日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

太棒了!TCP/IP协议 (图解+秒懂+史上最全)

發(fā)布時間:2023/12/9 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 太棒了!TCP/IP协议 (图解+秒懂+史上最全) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

TCP/IP協(xié)議的分層模型

在展開介紹TCP/IP協(xié)議之前,首先介紹一下七層ISO模型。國際標(biāo)準(zhǔn)化組織ISO為了使網(wǎng)絡(luò)應(yīng)用更為普及,推出了OSI參考模型,即開放式系統(tǒng)互聯(lián)(Open
System Interconnect)模型,
一般都叫OSI參考模型。OSI參考模型是ISO組織在1985年發(fā)布的網(wǎng)絡(luò)互連模型,其含義就是為所有公司使用一個統(tǒng)一的規(guī)范來控制網(wǎng)絡(luò),這樣所有公司遵循相同的通信規(guī)范,網(wǎng)絡(luò)就能互聯(lián)互通了。

OSI模型的七層框架

OSI模型定義了網(wǎng)絡(luò)互連的七層框架(物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會話層、表示層、應(yīng)用層),每一層實(shí)現(xiàn)各自的功能和協(xié)議,并完成與相鄰層的接口通信。OSI模型各層的通信協(xié)議,大致舉例如下表所示:

表:OSI模型各層的通信協(xié)議舉例

應(yīng)用層

HTTP、SMTP、SNMP、FTP、Telnet、SIP、SSH、NFS、RTSP、XMPP、Whois、ENRP、等等

表示層

XDR、ASN.1、SMB、AFP、NCP、等等

會話層

ASAP、SSH、RPC、NetBIOS、ASP、Winsock、BSD Sockets、等等

傳輸層

TCP、UDP、TLS、RTP、SCTP、SPX、ATP、IL、等等

網(wǎng)絡(luò)層

IP、ICMP、IGMP、IPX、BGP、OSPF、RIP、IGRP、EIGRP、ARP、RARP、X.25、等等

數(shù)據(jù)鏈路層

以太網(wǎng)、令牌環(huán)、HDLC、幀中繼、ISDN、ATM、IEEE 802.11、FDDI、PPP、等等

物理層

例如銅纜、網(wǎng)線、光纜、無線電等等

TCP/IP協(xié)議是Internet互聯(lián)網(wǎng)最基本的協(xié)議,其在一定程度上參考了七層ISO模型。OSI模型共有七層,從下到上分別是物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、運(yùn)輸層、會話層、表示層和應(yīng)用層。但是這顯然是有些復(fù)雜的,所以在TCP/IP協(xié)議中,七層被簡化為了四個層次。TCP/IP模型中的各種協(xié)議,依其功能不同,被分別歸屬到這四層之中,常被視為是簡化過后的七層OSI模型。

TCP/IP協(xié)議與七層ISO模型的對應(yīng)關(guān)系

TCP/IP協(xié)議與七層ISO模型的對應(yīng)關(guān)系,大致如下圖所示:

圖:TCP/IP協(xié)議與七層ISO模型的對應(yīng)關(guān)系

TCP/IP協(xié)議的應(yīng)用層的主要協(xié)議有HTTP、Telnet、FTP、SMTP等,是用來讀取來自傳輸層的數(shù)據(jù)或者將數(shù)據(jù)傳輸寫入傳輸層;傳輸層的主要協(xié)議有UDP、TCP,實(shí)現(xiàn)端對端的數(shù)據(jù)傳輸;網(wǎng)絡(luò)層的主要協(xié)議有ICMP、IP、IGMP,主要負(fù)責(zé)網(wǎng)絡(luò)中數(shù)據(jù)包的傳送等;鏈路層有時也稱作數(shù)據(jù)鏈路層或網(wǎng)絡(luò)接口層,主要協(xié)議有ARP、RARP,
通常包括操作系統(tǒng)中的設(shè)備驅(qū)動程序和計(jì)算機(jī)中對應(yīng)的網(wǎng)絡(luò)接口卡,它們一起處理與傳輸媒介(如電纜或其他物理設(shè)備)的物理接口細(xì)節(jié)。

(一)TCP/IP協(xié)議的應(yīng)用層

應(yīng)用層包括所有和應(yīng)用程序協(xié)同工作,并利用基礎(chǔ)網(wǎng)絡(luò)交換應(yīng)用程序的業(yè)務(wù)數(shù)據(jù)的協(xié)議。一些特定的程序被認(rèn)為運(yùn)行在這個層上,該層協(xié)議所提供的服務(wù)能直接支持用戶應(yīng)用。應(yīng)用層協(xié)議包括HTTP(萬維網(wǎng)服務(wù))、FTP(文件傳輸)、SMTP(電子郵件)、SSH(安全遠(yuǎn)程登陸)、DNS(域名解析)以及許多其他協(xié)議。

(二)TCP/IP協(xié)議的傳輸層

傳輸層的協(xié)議,解決了諸如端到端可靠性問題,能確保數(shù)據(jù)可靠的到達(dá)目的地,甚至能保證數(shù)據(jù)按照正確的順序到達(dá)目的地。傳輸層的主要功能大致如下:

(1)為端到端連接提供傳輸服務(wù);

(2)這種傳輸服務(wù)分為可靠和不可靠的,其中TCP是典型的可靠傳輸,而UDP則是不可靠傳輸;

(3)為端到端連接提供流量控制、差錯控制、QoS(Quality of
Service)服務(wù)質(zhì)量等管理服務(wù)。

傳輸層主要有兩個性質(zhì)不同的協(xié)議:TCP傳輸控制協(xié)議和UDP用戶數(shù)據(jù)報協(xié)議。

TCP協(xié)議是一個面向連接的、可靠的傳輸協(xié)議,它提供一種可靠的字節(jié)流,能保證數(shù)據(jù)完整、無損并且按順序到達(dá)。TCP盡量連續(xù)不斷地測試網(wǎng)絡(luò)的負(fù)載并且控制發(fā)送數(shù)據(jù)的速度以避免網(wǎng)絡(luò)過載。另外,TCP試圖將數(shù)據(jù)按照規(guī)定的順序發(fā)送。

UDP協(xié)議是一個無連接的數(shù)據(jù)報協(xié)議,是一個“盡力傳遞”和“不可靠”協(xié)議,不會對數(shù)據(jù)包是否已經(jīng)到達(dá)目的地進(jìn)行檢查,并且不保證數(shù)據(jù)包按順序到達(dá)。

總體來說,TCP協(xié)議傳輸效率低,但可靠性強(qiáng);UDP協(xié)議傳輸效率高,但可靠性略低,適用于傳輸可靠性要求不高、體量小的數(shù)據(jù)(比如QQ聊天數(shù)據(jù))。

(三)TCP/IP協(xié)議的網(wǎng)絡(luò)層

TCP/IP協(xié)議網(wǎng)絡(luò)層的作用是在復(fù)雜的網(wǎng)絡(luò)環(huán)境中為要發(fā)送的數(shù)據(jù)報找到一個合適的路徑進(jìn)行傳輸。簡單來說,網(wǎng)絡(luò)層負(fù)責(zé)將數(shù)據(jù)傳輸?shù)侥繕?biāo)地址,目標(biāo)地址可以是多個網(wǎng)絡(luò)通過路由器連接而成的某一個地址。另外,網(wǎng)絡(luò)層負(fù)責(zé)尋找合適的路徑到達(dá)對方計(jì)算機(jī),并把數(shù)據(jù)幀傳送給對方,網(wǎng)絡(luò)層還可以實(shí)現(xiàn)擁塞控制、網(wǎng)際互連等功能。網(wǎng)絡(luò)層協(xié)議的代表包括:ICMP、IP、IGMP等。

(四)TCP/IP協(xié)議的鏈路層

鏈路層有時也稱作數(shù)據(jù)鏈路層或網(wǎng)絡(luò)接口層,用來處理連接網(wǎng)絡(luò)的硬件部分。該層既包括操作系統(tǒng)硬件的設(shè)備驅(qū)動、NIC(網(wǎng)卡)、光纖等物理可見部分,還包括連接器等一切傳輸媒介。在這一層,數(shù)據(jù)的傳輸單位為比特。其主要協(xié)議有ARP、RARP等。

圖解 物理層:使用MAC解決設(shè)備的身份證問題

通信的原始時代

很久很久之前,你不與任何其他電腦相連接,孤苦伶仃。

直到有一天,你希望與另一臺電腦 B 建立通信,于是你們各開了一個網(wǎng)口,用一根網(wǎng)線連接了起來。

用一根網(wǎng)線連接起來怎么就能"通信"了呢?我可以給你講 IO、講中斷、講緩沖區(qū),但這不是研究網(wǎng)絡(luò)時該關(guān)心的問題。

如果你糾結(jié),要么去研究一下操作系統(tǒng)是如何處理網(wǎng)絡(luò) IO 的,要么去研究一下包是如何被網(wǎng)卡轉(zhuǎn)換成電信號發(fā)送出去的,要么就僅僅把它當(dāng)做電腦里有個小人在開槍吧~

反正,你們就是連起來了,并且可以通信。

有一天,一個新伙伴 C 加入了,但聰明的你們很快發(fā)現(xiàn),可以每個人開兩個網(wǎng)口,用一共三根網(wǎng)線,彼此相連。

隨著越來越多的人加入,你發(fā)現(xiàn)身上開的網(wǎng)口實(shí)在太多了,而且網(wǎng)線密密麻麻,混亂不堪。(而實(shí)際上一臺電腦根本開不了這么多網(wǎng)口,所以這種連線只在理論上可行,所以連不上的我就用紅色虛線表示了,就是這么嚴(yán)謹(jǐn)哈哈~)

集線器的誕生

于是你們發(fā)明了一個中間設(shè)備,你們將網(wǎng)線都插到這個設(shè)備上,由這個設(shè)備做轉(zhuǎn)發(fā),就可以彼此之間通信了,本質(zhì)上和原來一樣,只不過網(wǎng)口的數(shù)量和網(wǎng)線的數(shù)量減少了,不再那么混亂。

你給它取名叫集線器,它僅僅是無腦將電信號轉(zhuǎn)發(fā)到所有出口(廣播),不做任何處理,你覺得它是沒有智商的,因此把人家定性在了物理層。

由于轉(zhuǎn)發(fā)到了所有出口,那 BCDE 四臺機(jī)器怎么知道數(shù)據(jù)包是不是發(fā)給自己的呢?

首先,你要給所有的連接到交換機(jī)的設(shè)備,都起個名字。原來你們叫 ABCD,但現(xiàn)在需要一個更專業(yè)的,全局唯一的名字作為標(biāo)識,你把這個更高端的名字稱為?MAC 地址

你的 MAC 地址是 aa-aa-aa-aa-aa-aa,你的伙伴 b 的 MAC 地址是 bb-bb-bb-bb-bb-bb,以此類推,不重復(fù)就好。

這樣,A 在發(fā)送數(shù)據(jù)包給 B 時,只要在頭部拼接一個這樣結(jié)構(gòu)的數(shù)據(jù),就可以了。

B 在收到數(shù)據(jù)包后,根據(jù)頭部的目標(biāo) MAC 地址信息,判斷這個數(shù)據(jù)包的確是發(fā)給自己的,于是便收下

其他的 CDE 收到數(shù)據(jù)包后,根據(jù)頭部的目標(biāo) MAC 地址信息,判斷這個數(shù)據(jù)包并不是發(fā)給自己的,于是便丟棄

雖然集線器使整個布局干凈不少,但原來我只要發(fā)給電腦 B 的消息,現(xiàn)在卻要發(fā)給連接到集線器中的所有電腦,這樣既不安全,又不節(jié)省網(wǎng)絡(luò)資源。

圖解 數(shù)據(jù)鏈路:使用交換機(jī)解決MAC 地址映射問題

集線器的問題

如果把這個集線器弄得更智能一些,只發(fā)給目標(biāo) MAC 地址指向的那臺電腦,就好了。

交換機(jī)的誕生

雖然只比集線器多了這一點(diǎn)點(diǎn)區(qū)別,但看起來似乎有智能了,你把這東西叫做交換機(jī)。也正因?yàn)檫@一點(diǎn)點(diǎn)智能,你把它放在了另一個層級,數(shù)據(jù)鏈路層

如上圖所示,你是這樣設(shè)計(jì)的。

交換機(jī)內(nèi)部維護(hù)一張?MAC 地址表,記錄著每一個 MAC 地址的設(shè)備,連接在其哪一個端口上。

MAC 地址

端口

bb-bb-bb-bb-bb-bb

1

cc-cc-cc-cc-cc-cc

3

aa-aa-aa-aa-aa-aa

4

dd-dd-dd-dd-dd-dd

5

假如你仍然要發(fā)給 B 一個數(shù)據(jù)包,構(gòu)造了如下的數(shù)據(jù)結(jié)構(gòu)從網(wǎng)口出去。

到達(dá)交換機(jī)時,交換機(jī)內(nèi)部通過自己維護(hù)的 MAC 地址表,發(fā)現(xiàn)目標(biāo)機(jī)器 B 的 MAC 地址 bb-bb-bb-bb-bb-bb 映射到了端口 1 上,于是把數(shù)據(jù)從 1 號端口發(fā)給了 B,完事~

你給這個通過這樣傳輸方式而組成的小范圍的網(wǎng)絡(luò),叫做以太網(wǎng)。

當(dāng)然最開始的時候,MAC 地址表是空的,是怎么逐步建立起來的呢?

假如在 MAC 地址表為空是,你給 B 發(fā)送了如下數(shù)據(jù)

由于這個包從端口 4 進(jìn)入的交換機(jī),所以此時交換機(jī)就可以在 MAC地址表記錄第一條數(shù)據(jù):

MAC:aa-aa-aa-aa-aa-aa-aa
端口:4

交換機(jī)看目標(biāo) MAC 地址(bb-bb-bb-bb-bb-bb)在地址表中并沒有映射關(guān)系,于是將此包發(fā)給了所有端口,也即發(fā)給了所有機(jī)器。

之后,只有機(jī)器 B 收到了確實(shí)是發(fā)給自己的包,于是做出了響應(yīng),響應(yīng)數(shù)據(jù)從端口 1 進(jìn)入交換機(jī),于是交換機(jī)此時在地址表中更新了第二條數(shù)據(jù):

MAC:bb-bb-bb-bb-bb-bb
端口:1

過程如下

經(jīng)過該網(wǎng)絡(luò)中的機(jī)器不斷地通信,交換機(jī)最終將 MAC 地址表建立完畢~

隨著機(jī)器數(shù)量越多,交換機(jī)的端口也不夠了,但聰明的你發(fā)現(xiàn),只要將多個交換機(jī)連接起來,這個問題就輕而易舉搞定~

你完全不需要設(shè)計(jì)額外的東西,只需要按照之前的設(shè)計(jì)和規(guī)矩來,按照上述的接線方式即可完成所有電腦的互聯(lián),所以交換機(jī)設(shè)計(jì)的這種規(guī)則,真的很巧妙。你想想看為什么(比如 A 要發(fā)數(shù)據(jù)給 F)。

但是你要注意,上面那根紅色的線,最終在 MAC 地址表中可不是一條記錄呀,而是要把 EFGH 這四臺機(jī)器與該端口(端口6)的映射全部記錄在表中。

MAC 地址和端口的映射記錄

最終,兩個交換機(jī)將分別記錄 A ~ H 所有機(jī)器的映射記錄。

左邊的交換機(jī)

MAC 地址

端口

bb-bb-bb-bb-bb-bb

1

cc-cc-cc-cc-cc-cc

3

aa-aa-aa-aa-aa-aa

4

dd-dd-dd-dd-dd-dd

5

ee-ee-ee-ee-ee-ee

6

ff-ff-ff-ff-ff-ff

6

gg-gg-gg-gg-gg-gg

6

hh-hh-hh-hh-hh-hh

6

右邊的交換機(jī)

MAC 地址

端口

bb-bb-bb-bb-bb-bb

1

cc-cc-cc-cc-cc-cc

1

aa-aa-aa-aa-aa-aa

1

dd-dd-dd-dd-dd-dd

1

ee-ee-ee-ee-ee-ee

2

ff-ff-ff-ff-ff-ff

3

gg-gg-gg-gg-gg-gg

4

hh-hh-hh-hh-hh-hh

6

這在只有 8 臺電腦的時候還好,甚至在只有幾百臺電腦的時候,都還好,所以這種交換機(jī)的設(shè)計(jì)方式,已經(jīng)足足支撐一陣子了。

但很遺憾,人是貪婪的動物,很快,電腦的數(shù)量就發(fā)展到幾千、幾萬、幾十萬。

圖解 傳輸層:IP地址和路由器

二層交換機(jī)的問題

交換機(jī)已經(jīng)無法記錄如此龐大的映射關(guān)系了。

此時你動了歪腦筋,你發(fā)現(xiàn)了問題的根本在于,連出去的那根紅色的網(wǎng)線,后面不知道有多少個設(shè)備不斷地連接進(jìn)來,從而使得地址表越來越大。

那我可不可以讓那根紅色的網(wǎng)線,接入一個新的設(shè)備,這個設(shè)備就跟電腦一樣有自己獨(dú)立的 MAC 地址,而且同時還能幫我把數(shù)據(jù)包做一次轉(zhuǎn)發(fā)呢?

這個設(shè)備就是路由器,它的功能就是,作為一臺獨(dú)立的擁有 MAC 地址的設(shè)備,并且可以幫我把數(shù)據(jù)包做一次轉(zhuǎn)發(fā)你把它定在了網(wǎng)絡(luò)層。

注意,路由器的每一個端口,都有獨(dú)立的 MAC 地址

好了,現(xiàn)在交換機(jī)的 MAC 地址表中,只需要多出一條 MAC 地址 ABAB 與其端口的映射關(guān)系,就可以成功把數(shù)據(jù)包轉(zhuǎn)交給路由器了,這條搞定。

那如何做到,把發(fā)送給 C 和 D,甚至是把發(fā)送給 DEFGH.... 的數(shù)據(jù)包,統(tǒng)統(tǒng)先發(fā)送給路由器呢?

不難想到這樣一個點(diǎn)子,假如電腦 C 和 D 的 MAC 地址擁有共同的前綴,比如分別是

C 的 MAC 地址:FFFF-FFFF-CCCC?D 的 MAC 地址:FFFF-FFFF-DDDD

那我們就可以說,將目標(biāo) MAC 地址為?FFFF-FFFF-?開頭的,統(tǒng)統(tǒng)先發(fā)送給路由器。

這樣是否可行呢?答案是否定的。

IP地址的誕生

我們先從現(xiàn)實(shí)中 MAC 地址的結(jié)構(gòu)入手,MAC地址也叫物理地址、硬件地址,長度為 48 位,一般這樣來表示

00-16-EA-AE-3C-40

它是由網(wǎng)絡(luò)設(shè)備制造商生產(chǎn)時燒錄在網(wǎng)卡的EPROM(一種閃存芯片,通??梢酝ㄟ^程序擦寫)。

其中前 24 位(00-16-EA)代表網(wǎng)絡(luò)硬件制造商的編號,后 24 位(AE-3C-40)是該廠家自己分配的,一般表示系列號。

只要不更改自己的 MAC 地址,MAC 地址在世界是唯一的。形象地說,MAC地址就如同身份證上的身份證號碼,具有唯一性。

那如果你希望向上面那樣表示將目標(biāo) MAC 地址為?FFFF-FFFF-?開頭的,統(tǒng)一從路由器出去發(fā)給某一群設(shè)備(后面會提到這其實(shí)是子網(wǎng)的概念),那你就需要要求某一子網(wǎng)下統(tǒng)統(tǒng)買一個廠商制造的設(shè)備,要么你就需要要求廠商在生產(chǎn)網(wǎng)絡(luò)設(shè)備燒錄 MAC 地址時,提前按照你規(guī)劃好的子網(wǎng)結(jié)構(gòu)來定 MAC 地址,并且日后這個網(wǎng)絡(luò)的結(jié)構(gòu)都不能輕易改變。

這顯然是不現(xiàn)實(shí)的。

于是你發(fā)明了一個新的地址,給每一臺機(jī)器一個 32 位的編號,如:

11000000101010000000000000000001

你覺得有些不清晰,于是把它分成四個部分,中間用點(diǎn)相連。

11000000.10101000.00000000.00000001

你還覺得不清晰,于是把它轉(zhuǎn)換成 10 進(jìn)制。

192.168.0.1

最后你給了這個地址一個響亮的名字,IP 地址。現(xiàn)在每一臺電腦,同時有自己的 MAC 地址,又有自己的 IP 地址,只不過 IP 地址是軟件層面上的,可以隨時修改,MAC 地址一般是無法修改的。

這樣一個可以隨時修改的 IP 地址,就可以根據(jù)你規(guī)劃的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),來調(diào)整了。

如上圖所示,假如我想要發(fā)送數(shù)據(jù)包給 ABCD 其中一臺設(shè)備,不論哪一臺,我都可以這樣描述,"將 IP 地址為 192.168.0 開頭的全部發(fā)送給到路由器,之后再怎么轉(zhuǎn)發(fā),交給它!",巧妙吧。

路由器的誕生

路由器誕生了,專門負(fù)責(zé)IP地址的尋找。那報文交給路由器之后,路由器又是怎么把數(shù)據(jù)包準(zhǔn)確轉(zhuǎn)發(fā)給指定設(shè)備的呢?

別急我們慢慢來。

我們先給上面的組網(wǎng)方式中的每一臺設(shè)備,加上自己的 IP 地址

現(xiàn)在兩個設(shè)備之間傳輸,除了加上數(shù)據(jù)鏈路層的頭部之外,還要再增加一個網(wǎng)絡(luò)層的頭部。

假如 A 給 B 發(fā)送數(shù)據(jù),由于它們直接連著交換機(jī),所以 A 直接發(fā)出如下數(shù)據(jù)包即可,其實(shí)網(wǎng)絡(luò)層沒有體現(xiàn)出作用。

但假如 A 給 C 發(fā)送數(shù)據(jù),A 就需要先轉(zhuǎn)交給路由器,然后再由路由器轉(zhuǎn)交給 C。由于最底層的傳輸仍然需要依賴以太網(wǎng),所以數(shù)據(jù)包是分成兩段的。

A ~ 路由器這段的包如下:

路由器到 C 這段的包如下:

好了,上面說的兩種情況(A->B,A->C),相信細(xì)心的讀者應(yīng)該會有不少疑問,下面我們一個個來展開。

子網(wǎng)的由來

A 給 C 發(fā)數(shù)據(jù)包,怎么知道是否要通過路由器轉(zhuǎn)發(fā)呢?

答案:子網(wǎng)

如果源 IP 與目的 IP 處于一個子網(wǎng),直接將包通過交換機(jī)發(fā)出去。

如果源 IP 與目的 IP 不處于一個子網(wǎng),就交給路由器去處理。

好,那現(xiàn)在只需要解決,什么叫處于一個子網(wǎng)就好了。

  • 192.168.0.1 和 192.168.0.2 處于同一個子網(wǎng)
  • 192.168.0.1 和 192.168.1.1 處于不同子網(wǎng)

這兩個是我們?nèi)藶橐?guī)定的,即我們想表示,對于 192.168.0.1 來說:

192.168.0.xxx 開頭的,就算是在一個子網(wǎng),否則就是在不同的子網(wǎng)。

那對于計(jì)算機(jī)來說,怎么表達(dá)這個意思呢?于是人們發(fā)明了子網(wǎng)掩碼的概念

假如某臺機(jī)器的子網(wǎng)掩碼定為 255.255.255.0

這表示,將源 IP 與目的 IP 分別同這個子網(wǎng)掩碼進(jìn)行與運(yùn)算****,相等則是在一個子網(wǎng),不相等就是在不同子網(wǎng),就這么簡單。

比如

  • A電腦:192.168.0.1 & 255.255.255.0 = 192.168.0.0
  • B電腦:192.168.0.2 & 255.255.255.0 = 192.168.0.0
  • C電腦:192.168.1.1 & 255.255.255.0 = 192.168.1.0
  • D電腦:192.168.1.2 & 255.255.255.0 = 192.168.1.0

那么 A 與 B 在同一個子網(wǎng),C 與 D 在同一個子網(wǎng),但是 A 與 C 就不在同一個子網(wǎng),與 D 也不在同一個子網(wǎng),以此類推。

所以如果 A 給 C 發(fā)消息,A 和 C 的 IP 地址分別 & A 機(jī)器配置的子網(wǎng)掩碼,發(fā)現(xiàn)不相等,則 A 認(rèn)為 C 和自己不在同一個子網(wǎng),于是把包發(fā)給路由器,就不管了,之后怎么轉(zhuǎn)發(fā),A 不關(guān)心。

A 如何知道,哪個設(shè)備是路由器?

答案:在 A 上要設(shè)置默認(rèn)網(wǎng)關(guān)

上一步 A 通過是否與 C 在同一個子網(wǎng)內(nèi),判斷出自己應(yīng)該把包發(fā)給路由器,那路由器的 IP 是多少呢?

其實(shí)說發(fā)給路由器不準(zhǔn)確,應(yīng)該說 A 會把包發(fā)給默認(rèn)網(wǎng)關(guān)

對 A 來說,A 只能直接把包發(fā)給同處于一個子網(wǎng)下的某個 IP 上,所以發(fā)給路由器還是發(fā)給某個電腦,對 A 來說也不關(guān)心,只要這個設(shè)備有個 IP 地址就行。

所以默認(rèn)網(wǎng)關(guān),就是 A 在自己電腦里配置的一個 IP 地址,以便在發(fā)給不同子網(wǎng)的機(jī)器時,發(fā)給這個 IP 地址。

僅此而已!

路由表的由來(和Mac表的由來好像,都是逼出來的)

路由器如何知道C在哪里?

答案:路由表

現(xiàn)在 A 要給 C 發(fā)數(shù)據(jù)包,已經(jīng)可以成功發(fā)到路由器這里了,最后一個問題就是,路由器怎么知道,收到的這個數(shù)據(jù)包,該從自己的哪個端口出去,才能直接(或間接)地最終到達(dá)目的地 C 呢。

路由器收到的數(shù)據(jù)包有目的 IP 也就是 C 的 IP 地址,需要轉(zhuǎn)化成從自己的哪個端口出去,很容易想到,應(yīng)該有個表,就像 MAC 地址表一樣。

這個表就叫路由表

至于這個路由表是怎么出來的,有很多路由算法,本文不展開,因?yàn)槲乙膊粫

不同于 MAC 地址表的是,路由表并不是一對一這種明確關(guān)系,我們下面看一個路由表的結(jié)構(gòu)。

目的地址

子網(wǎng)掩碼

下一跳

端口

192.168.0.0

255.255.255.0

0

192.168.0.254

255.255.255.255

0

192.168.1.0

255.255.255.0

1

192.168.1.254

255.255.255.255

1

我們學(xué)習(xí)一種新的表示方法,由于子網(wǎng)掩碼其實(shí)就表示前多少位表示子網(wǎng)的網(wǎng)段,所以如 192.168.0.0(255.255.255.0) 也可以簡寫為 192.168.0.0/24

目的地址

下一跳

端口

192.168.0.0/24

0

192.168.0.254/32

0

192.168.1.0/24

1

192.168.1.254/32

1

這就很好理解了,路由表就表示,192.168.0.xxx 這個子網(wǎng)下的,都轉(zhuǎn)發(fā)到 0 號端口,192.168.1.xxx 這個子網(wǎng)下的,都轉(zhuǎn)發(fā)到 1 號端口。下一跳列還沒有值,我們先不管

配合著結(jié)構(gòu)圖來看(這里把子網(wǎng)掩碼和默認(rèn)網(wǎng)關(guān)都補(bǔ)齊了)

剛才說的都是 IP 層,但發(fā)送數(shù)據(jù)包的數(shù)據(jù)鏈路層需要知道 MAC 地址,可是我只知道 IP 地址該怎么辦呢?

答案:arp

假如你(A)此時不知道你同伴 B 的 MAC 地址(現(xiàn)實(shí)中就是不知道的,剛剛我們只是假設(shè)已知),你只知道它的 IP 地址,你該怎么把數(shù)據(jù)包準(zhǔn)確傳給 B 呢?

答案很簡單,在網(wǎng)絡(luò)層,我需要把 IP 地址對應(yīng)的 MAC 地址找到,也就是通過某種方式,找到?192.168.0.2?對應(yīng)的 MAC 地址?BBBB

這種方式就是?arp 協(xié)議,同時電腦 A 和 B 里面也會有一張?arp 緩存表,表中記錄著?IP 與 MAC 地址的對應(yīng)關(guān)系。

IP 地址

MAC 地址

192.168.0.2

BBBB

一開始的時候這個表是空的,電腦 A 為了知道電腦 B(192.168.0.2)的 MAC 地址,將會廣播一條 arp 請求,B 收到請求后,帶上自己的 MAC 地址給 A 一個響應(yīng)。此時 A 便更新了自己的 arp 表。

這樣通過大家不斷廣播 arp 請求,最終所有電腦里面都將 arp 緩存表更新完整。

圖解:整個傳輸過程

從各個節(jié)點(diǎn)的視角來看

電腦視角:

  • 首先我要知道我的 IP 以及對方的 IP
  • 通過子網(wǎng)掩碼判斷我們是否在同一個子網(wǎng)
  • 在同一個子網(wǎng)就通過 arp 獲取對方 mac 地址直接扔出去
  • 不在同一個子網(wǎng)就通過 arp 獲取默認(rèn)網(wǎng)關(guān)的 mac 地址直接扔出去

交換機(jī)視角:

  • 我收到的數(shù)據(jù)包必須有目標(biāo) MAC 地址
  • 通過 MAC 地址表查映射關(guān)系
  • 查到了就按照映射關(guān)系從我的指定端口發(fā)出去
  • 查不到就所有端口都發(fā)出去

路由器視角:

  • 我收到的數(shù)據(jù)包必須有目標(biāo) IP 地址
  • 通過路由表查映射關(guān)系
  • 查到了就按照映射關(guān)系從我的指定端口發(fā)出去(不在任何一個子網(wǎng)范圍,走其路由器的默認(rèn)網(wǎng)關(guān)也是查到了)
  • 查不到則返回一個路由不可達(dá)的數(shù)據(jù)包

如果你嗅覺足夠敏銳,你應(yīng)該可以感受到下面這句話:

網(wǎng)絡(luò)層(IP協(xié)議)本身沒有傳輸包的功能,包的實(shí)際傳輸是委托給數(shù)據(jù)鏈路層(以太網(wǎng)中的交換機(jī))來實(shí)現(xiàn)的。

涉及到的三張表分別是

  • 交換機(jī)中有?MAC 地址表用于映射 MAC 地址和它的端口
  • 路由器中有路由表用于映射 IP 地址(段)和它的端口
  • 電腦和路由器中都有** arp 緩存表**用于緩存 IP 和 MAC 地址的映射關(guān)系

這三張表是怎么來的

  • MAC 地址表是通過以太網(wǎng)內(nèi)各節(jié)點(diǎn)之間不斷通過交換機(jī)通信,不斷完善起來的。
  • 路由表是各種路由算法 + 人工配置逐步完善起來的。
  • arp 緩存表是不斷通過 arp 協(xié)議的請求逐步完善起來的。

知道了以上這些,目前網(wǎng)絡(luò)上兩個節(jié)點(diǎn)是如何發(fā)送數(shù)據(jù)包的這個過程,就完全可以解釋通了!

參考的網(wǎng)絡(luò)拓?fù)鋱D

那接下來我們就放上參考的?最后一個網(wǎng)絡(luò)拓?fù)鋱D吧,請做好?戰(zhàn)斗?準(zhǔn)備!

這時路由器 1 連接了路由器 2,所以其路由表有了下一條地址這一個概念,所以它的路由表就變成了這個樣子。如果匹配到了有下一跳地址的一項(xiàng),則需要再次匹配,找到其端口,并找到下一跳 IP 的 MAC 地址。

也就是說找來找去,最終必須能映射到一個端口號,然后從這個端口號把數(shù)據(jù)包發(fā)出去。

目的地址

下一跳

端口

192.168.0.0/24

0

192.168.0.254/32

0

192.168.1.0/24

1

192.168.1.254/32

1

192.168.2.0/24

192.168.100.5

192.168.100.0/24

2

192.168.100.4/32

2

這時如果 A 給 F 發(fā)送一個數(shù)據(jù)包,能不能通呢?如果通的話整個過程是怎樣的呢?

思考一分鐘...

詳細(xì)過程動畫描述:

詳細(xì)過程文字描述:

1.?首先 A(192.168.0.1)通過子網(wǎng)掩碼(255.255.255.0)計(jì)算出自己與 F(192.168.2.2)并不在同一個子網(wǎng)內(nèi),于是決定發(fā)送給默認(rèn)網(wǎng)關(guān)(192.168.0.254)

2.?A 通過 ARP 找到 默認(rèn)網(wǎng)關(guān) 192.168.0.254 的 MAC 地址。

3.?A 將源 MAC 地址(AAAA)與網(wǎng)關(guān) MAC 地址(ABAB)封裝在數(shù)據(jù)鏈路層頭部,又將源 IP 地址(192.168.0.1)和目的 IP 地址(192.168.2.2)(注意這里千萬不要以為填寫的是默認(rèn)網(wǎng)關(guān)的 IP 地址,從始至終這個數(shù)據(jù)包的兩個 IP 地址都是不變的,只有 MAC 地址在不斷變化)封裝在網(wǎng)絡(luò)層頭部,然后發(fā)包

4.?交換機(jī) 1 收到數(shù)據(jù)包后,發(fā)現(xiàn)目標(biāo) MAC 地址是 ABAB,轉(zhuǎn)發(fā)給路由器1

5.?數(shù)據(jù)包來到了路由器 1,發(fā)現(xiàn)其目標(biāo) IP 地址是 192.168.2.2,查看其路由表,發(fā)現(xiàn)了下一跳的地址是 192.168.100.5*

6.?所以此時路由器 1 需要做兩件事,第一件是再次匹配路由表,發(fā)現(xiàn)匹配到了端口為 2,于是將其封裝到數(shù)據(jù)鏈路層,最后把包從 2 號口發(fā)出去。

7.?此時路由器 2 收到了數(shù)據(jù)包,看到其目的地址是 192.168.2.2,查詢其路由表,匹配到端口號為 1,準(zhǔn)備從 1 號口把數(shù)據(jù)包送出去。

8.?但此時路由器 2 需要知道 192.168.2.2 的 MAC 地址了,于是查看其 arp 緩存,找到其 MAC 地址為 FFFF,將其封裝在數(shù)據(jù)鏈路層頭部,并從 1 號端口把包發(fā)出去。

9.?交換機(jī) 3 收到了數(shù)據(jù)包,發(fā)現(xiàn)目的 MAC 地址為 FFFF,查詢其 MAC 地址表,發(fā)現(xiàn)應(yīng)該從其 6 號端口出去,于是從 6 號端口把數(shù)據(jù)包發(fā)出去。

10.F 最終收到了數(shù)據(jù)包!**并且發(fā)現(xiàn)目的 MAC 地址就是自己,于是收下了這個包

HTTP報文傳輸原理

利用TCP/IP進(jìn)行網(wǎng)絡(luò)通信時,數(shù)據(jù)包會按照分層順序與對方進(jìn)行通信。發(fā)送端從應(yīng)用層往下走,接收端從鏈路層往上走。從客戶端到服務(wù)器的數(shù)據(jù),每一幀數(shù)據(jù)的傳輸?shù)捻樞蚨紴?#xff1a;應(yīng)用層->運(yùn)輸層->網(wǎng)絡(luò)層->鏈路層->鏈路層->網(wǎng)絡(luò)層->運(yùn)輸層->應(yīng)用層。

HTTP報文傳輸過程

以一個HTTP請求的傳輸為例,請求從HTTP客戶端(如瀏覽器)和HTTP服務(wù)端應(yīng)用的傳輸過程,大致如下圖所示:

圖:HTTP請求報文的分層傳輸過程

數(shù)據(jù)封裝和分用

接下來,為大家介紹一下數(shù)據(jù)封裝和分用。

數(shù)據(jù)通過互聯(lián)網(wǎng)傳輸?shù)臅r候不可能是光禿禿的不加標(biāo)識,如果這樣數(shù)據(jù)就會亂。所以數(shù)據(jù)在發(fā)送的時候,需要加上特定標(biāo)識,加上特定標(biāo)識的過程叫做數(shù)據(jù)的封裝,在數(shù)據(jù)使用的時候再去掉特定標(biāo)識,去掉特定標(biāo)識的過程就叫做分用。TCP/IP協(xié)議的數(shù)據(jù)封裝和分用過程,大致如下圖所示:

圖:TCP/IP協(xié)議的數(shù)據(jù)封裝和分用過程

在數(shù)據(jù)封裝時,數(shù)據(jù)經(jīng)過每個層都會打上該層特定標(biāo)識,添加上頭部。

在傳輸層封裝時,添加的報文首部時要存入一個應(yīng)用程序的標(biāo)識符,無論TCP和UDP都用一個16位的端口號來表示不同的應(yīng)用程序,并且都會將源端口和目的端口存入報文首部中。

在網(wǎng)絡(luò)層封裝時,IP首部會標(biāo)識處理數(shù)據(jù)的協(xié)議類型,或者說標(biāo)識出網(wǎng)絡(luò)層數(shù)據(jù)幀所攜帶的上層數(shù)據(jù)類型,如TCP、UDP、ICMP、IP、IGMP等等。
具體來說,會在IP首部中存入一個長度為8位的數(shù)值,稱作協(xié)議域:
1表示為ICMP協(xié)議、2表示為IGMP協(xié)議、6表示為TCP協(xié)議、17表示為UDP協(xié)議、等等。IP首部還會標(biāo)識發(fā)送方地址(源IP)和接收方地址(目標(biāo)IP)。

在鏈路層封裝時,網(wǎng)絡(luò)接口分別要發(fā)送和接收IP、ARP和RARP等多種不同協(xié)議的報文,因此也必須在以太網(wǎng)的幀首部中加入某種形式的標(biāo)識,以指明所處理的協(xié)議類型,為此,以太網(wǎng)的報文幀的首部也有一個16位的類型域,標(biāo)識出以太網(wǎng)數(shù)據(jù)幀所攜帶的上層數(shù)據(jù)類型,如IPv4、ARP、IPV6、PPPoE等等。

數(shù)據(jù)封裝和分用的過程大致為:發(fā)送端每通過一層會增加該層的首部,接收端每通過一層則刪除該層的首部。

總體來說,TCP/IP分層管理、數(shù)據(jù)封裝和分用的好處:分層之后若需改變相關(guān)設(shè)計(jì),只需替換變動的層。各層之間的接口部分規(guī)劃好之后,每個層次內(nèi)部的設(shè)計(jì)就可以自由改動。層次化之后,設(shè)計(jì)也變得相對簡單:各個層只需考慮分派給自己的傳輸任務(wù)。

TCP/IP與OSI的區(qū)別主要有哪些呢?除了TCP/IP與OSI在分層模塊上稍有區(qū)別,更重要的區(qū)別為:OSI參考模型注重“通信協(xié)議必要的功能是什么”,而TCP/IP則更強(qiáng)調(diào)“在計(jì)算機(jī)上實(shí)現(xiàn)協(xié)議應(yīng)該開發(fā)哪種程序”。

實(shí)際上,在傳輸過程中,數(shù)據(jù)報文會在不同的物理網(wǎng)絡(luò)之間傳遞,還是以一個HTTP請求的傳輸為例,請求在不同物理網(wǎng)絡(luò)之間的傳輸過程,大致如下圖所示:

圖:HTTP請求在不同物理網(wǎng)絡(luò)之間的傳輸過程

數(shù)據(jù)包在不同物理網(wǎng)絡(luò)之間的傳輸過程中,網(wǎng)絡(luò)層會通過路由器去對不同的網(wǎng)絡(luò)之間的數(shù)據(jù)包進(jìn)行存儲、分組轉(zhuǎn)發(fā)處理。構(gòu)造互連網(wǎng)最簡單的方法是把兩個或多個網(wǎng)絡(luò)通過路由器進(jìn)行連接。路由器可以簡單理解為一種特殊的用于網(wǎng)絡(luò)互連的硬件盒,其作用是為不同類型的物理網(wǎng)絡(luò)提供連接:以太網(wǎng)、令牌環(huán)網(wǎng)、點(diǎn)對點(diǎn)的鏈接和FDDI(光纖分布式數(shù)據(jù)接口)等等。

物理網(wǎng)絡(luò)之間通過路由器進(jìn)行互連,隨著增加不同類型的物理網(wǎng)絡(luò),可能會有很多個路由器,但是對于應(yīng)用層來說仍然是一樣的,TCP協(xié)議棧為大家屏蔽了物理層的復(fù)雜性??傊?#xff0c;物理細(xì)節(jié)和差異性的隱藏,使得互聯(lián)網(wǎng)TCP/IP傳輸?shù)墓δ茏兊梅浅?qiáng)大。

接下來,開始為大家介紹與傳輸性能有密切關(guān)系的內(nèi)容:TCP傳輸層的三次握手建立連接,四次揮手釋放連接。不過在此之前,還得先介紹一下TCP報文協(xié)議。

TCP協(xié)議的報文格式

在TCP/IP協(xié)議棧中,IP協(xié)議層只關(guān)心如何使數(shù)據(jù)能夠跨越本地網(wǎng)絡(luò)邊界的問題,而不關(guān)心數(shù)據(jù)如何傳輸。整體TCP/IP協(xié)議棧,共同配合一起解決數(shù)據(jù)如何通過許許多多個點(diǎn)對點(diǎn)通路,順利傳輸?shù)竭_(dá)目的地。一個點(diǎn)對點(diǎn)通路被稱為一“跳”(hop),通過TCP/IP協(xié)議棧,網(wǎng)絡(luò)成員能夠在許多“跳”的基礎(chǔ)上建立相互的數(shù)據(jù)通路。

傳輸層TCP協(xié)議提供了一種面向連接的、可靠的字節(jié)流服務(wù),其數(shù)據(jù)幀格式,大致如下圖所示:

圖:傳輸層TCP協(xié)議的數(shù)據(jù)幀格式

一個傳輸層TCP協(xié)議的數(shù)據(jù)幀,大致包含以下字段:

(一)源端口號

源端口號表示報文的發(fā)送端口,占16位。源端口和源IP地址組合起來,可以標(biāo)識報文的發(fā)送地址。

(二)目的端口號

目的端口號表示報文的接收端口,占16位。目的端口和目的IP地址相結(jié)合,可以標(biāo)識報文的接收地址。

TCP協(xié)議是基于IP協(xié)議的基礎(chǔ)上傳輸?shù)?#xff0c;TCP報文中的源端口號+源IP,與TCP報文中的目的端口號+目的IP一起,組合起來唯一性的確定一條TCP連接。

(三)序號(Sequence Number)

TCP傳輸過程中,在發(fā)送端出的字節(jié)流中,傳輸報文中的數(shù)據(jù)部分的每一個字節(jié)都有它的編號。序號(Sequence
Number)占32位,發(fā)起方發(fā)送數(shù)據(jù)時,都需要標(biāo)記序號。

序號(Sequence Number)的語義與SYN控制標(biāo)志(Control
Bits)的值有關(guān)。根據(jù)控制標(biāo)志(Control Bits)中的SYN是否為1,序號(Sequence
Number)表達(dá)不同的含義:

(1)當(dāng)SYN = 1時,當(dāng)前為連接建立階段,此時的序號為初始序號ISN((Initial Sequence
Number),通過算法來隨機(jī)生成序號;

(2)當(dāng)SYN = 0時在數(shù)據(jù)傳輸正式開始時,第一個報文的序號為 ISN +
1,后面的報文的序號,為前一個報文的SN值+TCP報文的凈荷字節(jié)數(shù)(不包含TCP頭)。比如,如果發(fā)送端發(fā)送的一個TCP幀的凈荷為12byte,序號為5,則發(fā)送端接著發(fā)送的下一個數(shù)據(jù)包的時候,序號的值應(yīng)該設(shè)置為5+12=17。

在數(shù)據(jù)傳輸過程中,TCP協(xié)議通過序號(Sequence
Number)對上層提供有序的數(shù)據(jù)流。發(fā)送端可以用序號來跟蹤發(fā)送的數(shù)據(jù)量;接收端可以用序號識別出重復(fù)接收到的TCP包,從而丟棄重復(fù)包;對于亂序的數(shù)據(jù)包,接收端也可以依靠序號對其進(jìn)行排序。

(四)確認(rèn)序號(Acknowledgment Number)

確認(rèn)序號(Acknowledgment
Number)標(biāo)識了報文接收端期望接收的字節(jié)序列。如果設(shè)置了ACK控制位,確認(rèn)序號的值表示一個準(zhǔn)備接收的包的序列碼,注意,它所指向的是準(zhǔn)備接收的包,也就是下一個期望接收的包的序列碼。

舉個例子,假設(shè)發(fā)送端(如Client)發(fā)送3個凈荷為1000byte、起始SN序號為1的數(shù)據(jù)包給Server服務(wù)端,Server每收到一個包之后,需要回復(fù)一個ACK響應(yīng)確認(rèn)數(shù)據(jù)包給Client。ACK響應(yīng)數(shù)據(jù)包的ACK
Number值,為每個Client包的為SN+包凈荷,既表示Server已經(jīng)確認(rèn)收到的字節(jié)數(shù),還表示期望接收到的下一個Client發(fā)送包的SN序號,具體的ACK值如下圖左邊的正常傳輸部分所示。

圖:傳輸過程的確認(rèn)序號(Acknowledgment Number)值示例圖

在上圖的左邊部分,Server第1個ACK包的ACK
Number值為1001,是通過Client第1個包的SN+包凈荷=1+1000計(jì)算得到,表示期望第2個Client包的SN序號為1001;Server第2個ACK包的ACK
Number值為2001,為Client第2個包的SN+包凈荷=2001,表示期望第3個Server包的SN為2001,以此類推。

如果發(fā)生錯誤,假設(shè)Server在處理Client的第二個發(fā)送包異常,Server仍然回復(fù)一個ACK
Number值為1001的確認(rèn)包,則Client的第二個數(shù)據(jù)包需要重復(fù)發(fā)送,具體的ACK值如上圖右邊的正常傳輸部分所示。

只有控制標(biāo)志的ACK標(biāo)志為1時,數(shù)據(jù)幀中的確認(rèn)序號ACK
Number才有效。TCP協(xié)議規(guī)定,連接建立后,所有發(fā)送的報文的ACK必須為1,也就是建立連接后,所有報文的確認(rèn)序號有效。如果是SYN類型的報文,其ACK標(biāo)志為0,故沒有確認(rèn)序號。

(五)頭部長度

該字段占用4位,用來表示TCP報文首部的長度,單位是4bit位。其值所表示的并不是字節(jié)數(shù),而是頭部的所含有的32bit的數(shù)目(或者倍數(shù)),或者4個字節(jié)的倍數(shù),所以TCP頭部最多可以有60字節(jié)(4*15=60)。沒有任何選項(xiàng)字段的TCP頭部長度為20字節(jié),所以其頭部長度為5,可以通過20/4=5計(jì)算得到。

(六)預(yù)留6位

頭部長度后面預(yù)留的字段長度為6位,作為保留字段,暫時沒有什么用處。

(七)控制標(biāo)志

控制標(biāo)志(Control
Bits)共6個bit位,具體的標(biāo)志位為:URG、ACK、PSH、RST、SYN、FIN。6個標(biāo)志位的說明,如下表所示。

表:TCP報文控制標(biāo)志(Control Bits)說明

標(biāo)志位

說明

URG

占1位,表示緊急指針字段有效。URG位指示報文段里的上層實(shí)體(數(shù)據(jù))標(biāo)記為“緊急”數(shù)據(jù)。當(dāng)URG=1時,其后的緊急指針指示緊急數(shù)據(jù)在當(dāng)前數(shù)據(jù)段中的位置(相對于當(dāng)前序列號的字節(jié)偏移量),TCP接收方必須通知上層實(shí)體。

ACK

占1位,置位ACK=1表示確認(rèn)號字段有效;TCP協(xié)議規(guī)定,接建立后所有發(fā)送的報文的ACK必須為1;當(dāng)ACK=0時,表示該數(shù)據(jù)段不包含確認(rèn)信息。當(dāng)ACK=1時,表示該報文段包括一個對已被成功接收報文段的確認(rèn)序號Acknowledgment Number,該序號同時也是下一個報文的預(yù)期序號。

PSH

占1位,表示當(dāng)前報文需要請求推(push)操作;當(dāng)PSH=1時,接收方在收到數(shù)據(jù)后立即將數(shù)據(jù)交給上層,而不是直到整個緩沖區(qū)滿。

RST

占1位,置位RST=1表示復(fù)位TCP連接;用于重置一個已經(jīng)混亂的連接,也可用于拒絕一個無效的數(shù)據(jù)段或者拒絕一個連接請求。如果數(shù)據(jù)段被設(shè)置了RST位,說明報文發(fā)送方有問題發(fā)生。

SYN

占1位,在連接建立時用來同步序號。當(dāng)SYN=1而ACK=0時,表明這是一個連接請求報文。對方若同意建立連接,則應(yīng)在響應(yīng)報文中使SYN=1和ACK=1。 綜合一下,SYN置1就表示這是一個連接請求或連接接受報文。

FIN

占1位,用于在釋放TCP連接時,標(biāo)識發(fā)送方比特流結(jié)束,用來釋放一個連接。當(dāng) FIN = 1時,表明此報文的發(fā)送方的數(shù)據(jù)已經(jīng)發(fā)送完畢,并要求釋放連接。

在連接建立的三次握手過程中,若只是單個SYN置位,表示的只是建立連接請求。如果SYN和ACK同時置位為1,表示的建立連接之后的響應(yīng)。

(八)窗口大小:

長度為16位,共2個字節(jié)。此字段用來進(jìn)行流量控制。流量控制的單位為字節(jié)數(shù),這個值是本端期望一次接收的字節(jié)數(shù)。

(九)校驗(yàn)和:

長度為16位,共2個字節(jié)。對整個TCP報文段,即TCP頭部和TCP數(shù)據(jù)進(jìn)行校驗(yàn)和計(jì)算,接收端用于對收到的數(shù)據(jù)包進(jìn)行驗(yàn)證。

(十)緊急指針:

長度為16米,2個字節(jié)。它是一個偏移量,和SN序號值相加表示緊急數(shù)據(jù)最后一個字節(jié)的序號。

以上十項(xiàng)內(nèi)容是TCP報文首部必須的字段,也稱固有字段,長度為20個字節(jié)。接下來是TCP報文的可選項(xiàng)和填充部分。

(十一)可選項(xiàng)和填充部分

可選項(xiàng)和填充部分的長度為4n字節(jié)(n是整數(shù)),該部分是根據(jù)需要而增加的選項(xiàng)。如果不足4n字節(jié),要加填充位,使得選項(xiàng)長度為32位(4字節(jié))的整數(shù)倍,具體的做法是在這個字段中加入額外的零,以確保TCP頭是32位(4字節(jié))的整數(shù)倍。

最常見的選項(xiàng)字段是MSS(Maximum Segment
Size最長報文大小),每個連接方通常都在通信的第一個報文段(SYN標(biāo)志為1的那個段)中指明這個選項(xiàng)字段,表示當(dāng)前連接方所能接受的最大報文段的長度。

由于可選項(xiàng)和填充部分不是必須的,所以TCP報文首部最小長度為20個字節(jié)。

至此,TCP報文首部的字段,就全部介紹完了。TCP報文首部的后面,接著的是數(shù)據(jù)部分,不過數(shù)據(jù)部分是可選的。在一個連接建立和一個連接終止時,雙方交換的報文段僅有TCP首部。如果一方?jīng)]有數(shù)據(jù)要發(fā)送,也使用沒有任何數(shù)據(jù)的首部來確認(rèn)收到的數(shù)據(jù),比如在處理超時的過程中,也會發(fā)送不帶任何數(shù)據(jù)的報文段。

總體來說,TCP協(xié)議的可靠性,主要通過以下幾點(diǎn)來保障:

(1)應(yīng)用數(shù)據(jù)分割成TCP認(rèn)為最適合發(fā)送的數(shù)據(jù)塊。這部分是通過MSS(最大數(shù)據(jù)包長度)選項(xiàng)來控制的,通常這種機(jī)制也被稱為一種協(xié)商機(jī)制,MSS規(guī)定了TCP傳往另一端的最大數(shù)據(jù)塊的長度。值得注意的是,MSS只能出現(xiàn)在SYN報文段中,若一方不接收來自另一方的MSS值,則MSS就定為536字節(jié)。一般來講,MSS值還是越大越好,這樣可以提高網(wǎng)絡(luò)的利用率。

(2)重傳機(jī)制。設(shè)置定時器,等待確認(rèn)包,如果定時器超時還沒有收到確認(rèn)包,則報文重傳。

(3)對首部和數(shù)據(jù)進(jìn)行校驗(yàn)。

(4)接收端對收到的數(shù)據(jù)進(jìn)行排序,然后交給應(yīng)用層。

(5)接收端丟棄重復(fù)的數(shù)據(jù)。

(6)TCP還提供流量控制,主要是通過滑動窗口來實(shí)現(xiàn)流量控制。

至此TCP協(xié)議的數(shù)據(jù)幀格式介紹完了。接下來開始為大家重點(diǎn)介紹:TCP傳輸層的三次握手建立連接,四次揮手釋放連接。

TCP的三次握手

TCP連接的建立時,雙方需要經(jīng)過三次握手,而斷開連接時,雙方需要經(jīng)過四次分手,那么,其三次握手和四次分手分別做了什么呢?又是如何進(jìn)行的呢?

通常情況下,建立連接的雙方,由一端打開一個監(jiān)聽套接字(ServerSocket)來監(jiān)聽來自請求方的TCP(Socket)連接,當(dāng)服務(wù)器端監(jiān)聽開始時,必須做好準(zhǔn)備接受外來的連接,在Java中該操作通過創(chuàng)建一個ServerSocket服務(wù)監(jiān)聽套接字實(shí)例來完成,此操作會調(diào)用底層操作系統(tǒng)(如Linux)的C代碼中三個函數(shù)socket()、bind()、listen()
來完成。開始監(jiān)聽之后,服務(wù)器端就做好接受外來連接的準(zhǔn)備,如果監(jiān)聽到建立新連接的請求,會開啟一個傳輸套接字,稱之為被動打開(Passive
Open)。

一段簡單的服務(wù)端監(jiān)聽新連接請求,并且被動打開(Passive
Open)傳輸套接字的Java示例代碼,具體如下:

public class SocketServer {public static void main(String[] args) {try {// 創(chuàng)建服務(wù)端socketServerSocket serverSocket = new ServerSocket(8080);//循環(huán)監(jiān)聽等待客戶端的連接while(true){//監(jiān)聽到客戶端連接,傳輸套接字被動開啟Socket socket = serverSocket.accept();//開啟線程進(jìn)行連接的IO處理ServerThread thread = new ServerThread(socket);thread.start();......}} catch (Exception e) {// 處理異常e.printStackTrace();}}}

客戶端在發(fā)起連接建立時,Java代碼通過創(chuàng)建Socket實(shí)例,調(diào)用底層的connect(…)方法,主動打開(Active
Open)Socket連接。套接字監(jiān)聽方在收到請求之后,監(jiān)聽方和發(fā)起方(客戶端)之間就會建立一條的連接通道,該通道由雙方IP和雙方端口所唯一確定。

一段簡單的客戶端連接主動打開(Active Open)的Java示例代碼,具體如下:

public class SocketClient {public static void main(String[] args) throws InterruptedException {try {// 和服務(wù)器創(chuàng)建連接Socket socket = new Socket("localhost",8080);// 寫入給監(jiān)聽方的輸出流OutputStream os = socket.getOutputStream();…..// 讀取監(jiān)聽方的輸入流InputStream is = socket.getInputStream();…..} catch (Exception e) {e.printStackTrace();}}}

三次握手過程

TCP連接的建立時,雙方需要經(jīng)過三次握手,具體過程如下:

(1)第一次握手:Client進(jìn)入SYN_SENT狀態(tài),發(fā)送一個SYN幀來主動打開傳輸通道,該幀的SYN標(biāo)志位被設(shè)置為1,同時會帶上Client分配好的SN序列號,該SN是根據(jù)時間產(chǎn)生的一個隨機(jī)值,通常情況下每間隔4ms會加1。除此之外,SYN幀還會帶一個MSS(最大報文段長度)可選項(xiàng)的值,表示客戶端發(fā)送出去的最大數(shù)據(jù)塊的長度。

(2)第二次握手:Server端在收到SYN幀之后,會進(jìn)入SYN_RCVD狀態(tài),同時返回SYN+ACK幀給Client,主要目的在于通知Client,Server端已經(jīng)收到SYN消息,現(xiàn)在需要進(jìn)行確認(rèn)。Server端發(fā)出的SYN+ACK幀的ACK標(biāo)志位被設(shè)置為1,其確認(rèn)序號AN(Acknowledgment
Number)值被設(shè)置為Client的SN+1;SYN+ACK幀的SYN標(biāo)志位被設(shè)置為1,SN值為Server端生成的SN序號;SYN+ACK幀的MSS(最大報文段長度)表示的是Server端的最大數(shù)據(jù)塊長度。

(3)第三次握手:Client在收到Server的第二次握手SYN+ACK確認(rèn)幀之后,首先將自己的狀態(tài)會從SYN_SENT變成ESTABLISHED,表示自己方向的連接通道已經(jīng)建立成功,Client可以發(fā)送數(shù)據(jù)給Server端了。然后,Client發(fā)ACK幀給Server端,該ACK幀的ACK標(biāo)志位被設(shè)置為1,其確認(rèn)序號AN(Acknowledgment
Number)值被設(shè)置為Server端的SN序列號+1。還有一種情況,Client可能會將ACK幀和第一幀要發(fā)送的數(shù)據(jù),合并到一起發(fā)送給Server端。

(4)Server端在收到Client的ACK幀之后,會從SYN_RCVD狀態(tài)會進(jìn)入ESTABLISHED狀態(tài),至此,Server方向的通道連接建立成功,Server可以發(fā)送數(shù)據(jù)給Client,TCP的全雙工連接建立完成。

三次握手的圖解

三次握手的交互過程,具體如下圖所示:

圖:TCP建立的連接時三次握手示意圖

Client和Server完成了三次握手后,雙方就進(jìn)入了數(shù)據(jù)傳輸?shù)碾A段。數(shù)據(jù)傳輸完成后,連接將斷開,連接斷開的過程需要經(jīng)歷四次揮手。

TCP的四次揮手

業(yè)務(wù)數(shù)據(jù)通信完成之后,TCP連接開始斷開(或者拆接)的過程,在這個過程中連接的每個端的都能獨(dú)立地、主動的發(fā)起,斷開的過程TCP協(xié)議使用了四路揮手操作。

四次揮手具體過程

四次揮手具體過程,具體如下:

(1)第一次揮手:主動斷開方(可以是客戶端,也可以是服務(wù)器端),向?qū)Ψ桨l(fā)送一個FIN結(jié)束請求報文,此報文的FIN位被設(shè)置為1,并且正確設(shè)置Sequence
Number(序列號)和Acknowledgment
Number(確認(rèn)號)。發(fā)送完成后,主動斷開方進(jìn)入FIN_WAIT_1狀態(tài),這表示主動斷開方?jīng)]有業(yè)務(wù)數(shù)據(jù)要發(fā)送給對方,準(zhǔn)備關(guān)閉SOCKET連接了。

(2)第二次揮手:正常情況下,在收到了主動斷開方發(fā)送的FIN斷開請求報文后,被動斷開方會發(fā)送一個ACK響應(yīng)報文,報文的Acknowledgment
Number(確認(rèn)號)值為斷開請求報文的Sequence Number
(序列號)加1,該ACK確認(rèn)報文的含義是:“我同意你的連接斷開請求”。之后,被動斷開方就進(jìn)入了CLOSE-WAIT(關(guān)閉等待)狀態(tài),TCP協(xié)議服務(wù)會通知高層的應(yīng)用進(jìn)程,對方向本地方向的連接已經(jīng)關(guān)閉,對方已經(jīng)沒有數(shù)據(jù)要發(fā)送了,若本地還要發(fā)送數(shù)據(jù)給對方,對方依然會接受。被動斷開方的CLOSE-WAIT(關(guān)閉等待)還要持續(xù)一段時間,也就是整個CLOSE-WAIT狀態(tài)持續(xù)的時間。

主動斷開方在收到了ACK報文后,由FIN_WAIT_1轉(zhuǎn)換成FIN_WAIT_2狀態(tài)。

(3)第三次揮手:在發(fā)送完成ACK報文后,被動斷開方還可以繼續(xù)完成業(yè)務(wù)數(shù)據(jù)的發(fā)送,待剩余數(shù)據(jù)發(fā)送完成后,或者CLOSE-WAIT(關(guān)閉等待)截止后,被動斷開方會向主動斷開方發(fā)送一個FIN+ACK結(jié)束響應(yīng)報文,表示被動斷開方的數(shù)據(jù)都發(fā)送完了,然后,被動斷開方進(jìn)入LAST_ACK狀態(tài)。

(4)第四次揮手:主動斷開方收在到FIN+ACK斷開響應(yīng)報文后,還需要進(jìn)行最后的確認(rèn),向被動斷開方發(fā)送一個ACK確認(rèn)報文,然后,自己就進(jìn)入TIME_WAIT狀態(tài),等待超時后最終關(guān)閉連接。處于TIME_WAIT狀態(tài)的主動斷開方,在等待完成2MSL的時間后,如果期間沒有收到其他報文,則證明對方已正常關(guān)閉,主動斷開方的連接最終關(guān)閉。

被動斷開方在收到主動斷開方的最后的ACK報文以后,最終關(guān)閉了連接,自己啥也不管了。

四次揮手圖解

四次揮手的全部交互過程,具體如下圖所示:

圖:TCP建立的連接時四次揮手的示意圖

處于TIME_WAIT狀態(tài)的主動斷開方,在等待完成2MSL的時間后,才真正關(guān)閉連接通道,其等待的時間為什么是2MSL呢?

2MSL翻譯過來就是兩倍的MSL。MSL全稱為Maximum Segment
Lifetime,指的是一個TCP報文片段在網(wǎng)絡(luò)中最大的存活時間,具體來說,2MSL對應(yīng)于一次消息的來回(一個發(fā)送和一個回復(fù))所需的最大時間。如果直到2MSL,主動斷開方都沒有再一次收到對方的報文(如FIN報文),則可以推斷ACK已經(jīng)被對方成功接收,此時,主動斷開方將最終結(jié)束自己的TCP連接。所以,TCP的TIME_WAIT狀態(tài)也稱為2MSL等待狀態(tài)。

有關(guān)MSL的具體的時間長度,在RFC1122協(xié)議中推薦為2分鐘。在SICS(瑞典計(jì)算機(jī)科學(xué)院)開發(fā)的一個小型開源的TCP/IP協(xié)議棧——LwIP開源協(xié)議棧中MSL默認(rèn)為1分鐘。在源自Berkeley的TCP協(xié)議棧實(shí)現(xiàn)中MSL默認(rèn)長度為30秒??傮w來說,TIME_WAIT(2MSL)等待狀態(tài)的時間長度,一般維持在1-4分鐘之間。

通過三次握手建立連接和四次揮手拆除連接,一次TCP的連接建立及拆除,至少進(jìn)行7次通信,可見其成本是很高的。

三次握手、四次揮手的常見面試題

有關(guān)TCP的連接建立的三次握手及拆除過程的四次揮手的面試問題,是技術(shù)面試過程中的出現(xiàn)頻率很高的重點(diǎn)和難點(diǎn)問題,常見問題大致如下:

問題(1):為什么關(guān)閉連接的需要四次揮手,而建立連接卻只要三次握手呢?

關(guān)閉連接時,被動斷開方在收到對方的FIN結(jié)束請求報文時,很可能業(yè)務(wù)數(shù)據(jù)沒有發(fā)送完成,并不能立即關(guān)閉連接,被動方只能先回復(fù)一個ACK響應(yīng)報文,告訴主動斷開方:“你發(fā)的FIN報文我收到了,只有等到我所有的業(yè)務(wù)報文都發(fā)送完了,我才能真正的結(jié)束,在結(jié)束之前,我會發(fā)你FIN+ACK報文的,你先等著”。所以,被動斷開方的確認(rèn)報文,需要拆開成為兩步,故總體就需要四步揮手。

而在建立連接場景中,Server端的應(yīng)答可以稍微簡單一些。當(dāng)Server端收到Client端的SYN連接請求報文后,其中ACK報文表示對請求報文的應(yīng)答,SYN報文用來表示服務(wù)端的連接也已經(jīng)同步開啟了,而ACK報文和SYN報文之間,不會有其他報文需要發(fā)送,故而可以合二為一,可以直接發(fā)送一個SYN+ACK報文。所以,在建立連接時,只需要三次握手即可。

問題(2):為什么連接建立的時候是三次握手,可以改成兩次握手嗎?

三次握手完成兩個重要的功能:一是雙方都做好發(fā)送數(shù)據(jù)的準(zhǔn)備工作,而且雙方都知道對方已準(zhǔn)備好;二是雙方完成初始SN序列號的協(xié)商,雙方的SN序列號在握手過程中被發(fā)送和確認(rèn)。

如果把三次握手改成兩次握手,可能發(fā)生死鎖。兩次握手的話,缺失了Client的二次確認(rèn)ACK幀,假想的TCP建立的連接時二次揮手,可以如下圖所示:

圖:假想的TCP建立的連接時二次握手的示意圖

在假想的TCP建立的連接時二次握手過程中,Client發(fā)送Server發(fā)送一個SYN請求幀,Server收到后發(fā)送了確認(rèn)應(yīng)答SYN+ACK幀。按照兩次握手的協(xié)定,Server認(rèn)為連接已經(jīng)成功地建立了,可以開始發(fā)送數(shù)據(jù)幀。這個過程中,如果確認(rèn)應(yīng)答SYN+ACK幀在傳輸中被丟失,Client沒有收到,Client將不知道Server是否已準(zhǔn)備好,也不知道Server的SN序列號,Client認(rèn)為連接還未建立成功,將忽略Server發(fā)來的任何數(shù)據(jù)分組,會一直等待Server的SYN+ACK確認(rèn)應(yīng)答幀。而Server在發(fā)出的數(shù)據(jù)幀后,一直沒有收到對應(yīng)的ACK確認(rèn)后就會產(chǎn)生超時,重復(fù)發(fā)送同樣的數(shù)據(jù)幀。這樣就形成了死鎖。

問題(3):為什么主動斷開方在TIME-WAIT狀態(tài)必須等待2MSL的時間?

原因之一:主動斷開方等待2MSL的時間,是為了確保兩端都能最終關(guān)閉。假設(shè)網(wǎng)絡(luò)是不可靠的,被動斷開方發(fā)送FIN+ACK報文后,其主動方的ACK響應(yīng)報文有可能丟失,這時候的被動斷開方處于LAST-ACK狀態(tài)的,由于收不到ACK確認(rèn)被動方一直不能正常的進(jìn)入CLOSED狀態(tài)。在這種場景下,被動斷開方會超時重傳FIN+ACK斷開響應(yīng)報文,如果主動斷開方在2MSL時間內(nèi),收到這個重傳的FIN+ACK報文,會重傳一次ACK報文,后再一次重新啟動2MSL計(jì)時等待,這樣,就能確保被動斷開方能收到ACK報文,從而能確保被動方順利進(jìn)入到CLOSED狀態(tài)。只有這樣,雙方都能夠確保關(guān)閉。反過來說,如果主動斷開方在發(fā)送完ACK響應(yīng)報文后,不是進(jìn)入TIME_WAIT狀態(tài)去等待2MSL時間,而是立即釋放連接,則將無法收到被動方重傳的FIN+ACK報文,所以不會再發(fā)送一次ACK確認(rèn)報文,此時處于LAST-ACK狀態(tài)的被動斷開方,無法正常進(jìn)入到CLOSED狀態(tài)。

原因之二:防止“舊連接的已失效的數(shù)據(jù)報文”出現(xiàn)在新連接中。主動斷開方在發(fā)送完最后一個ACK報文后,再經(jīng)過2MSL,才能最終關(guān)閉和釋放端口,這就意味著,相同端口的新TCP新連接,需要在2MSL的時間之后,才能夠正常的建立。2MSL這段時間內(nèi),舊連接所產(chǎn)生的所有數(shù)據(jù)報文,都已經(jīng)從網(wǎng)絡(luò)中消失了,從而,確保了下一個新的連接中不會出現(xiàn)這種舊連接請求報文。

問題(4):如果已經(jīng)建立了連接,但是Client端突然出現(xiàn)故障了怎么辦?

TCP還設(shè)有一個保活計(jì)時器,Client端如果出現(xiàn)故障,Server端不能一直等下去,這樣會浪費(fèi)系統(tǒng)資源。每收到一次Client客戶端的數(shù)據(jù)幀后,Server端都的?;钣?jì)時器會復(fù)位。計(jì)時器的超時時間通常是設(shè)置為2小時,若2小時還沒有收到Client端的任何數(shù)據(jù)幀,Server端就會發(fā)送一個探測報文段,以后每隔75秒鐘發(fā)送一次。若一連發(fā)送10個探測報文仍然沒反應(yīng),Server端就認(rèn)為Client端出了故障,接著就關(guān)閉連接。如果覺得保活計(jì)時器的兩個多小時的間隔太長,可以自行調(diào)整TCP連接的?;顓?shù)。

總結(jié)

以上是生活随笔為你收集整理的太棒了!TCP/IP协议 (图解+秒懂+史上最全)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。