TCP IP基础知识的复习
TCP/IP網(wǎng)絡(luò)協(xié)議棧分為應(yīng)用層(Application)、傳輸層(Transport)、網(wǎng)絡(luò)層(Network)和鏈路層(Link)四層。如下圖所示
兩臺計算機(jī)通過TCP/IP協(xié)議通訊的過程如下所示
傳輸層及其以下的機(jī)制由內(nèi)核提供,應(yīng)用層由用戶進(jìn)程提供,應(yīng)用程序?qū)νㄓ崝?shù)據(jù)的含義進(jìn)行解釋,而傳輸層及其以下處理通訊的細(xì)節(jié),將數(shù)據(jù)從一臺計算機(jī)通過一定的路徑發(fā)送到另一臺計算機(jī)。應(yīng)用層數(shù)據(jù)通過協(xié)議棧發(fā)到網(wǎng)絡(luò)上時,每層協(xié)議都要加上一個數(shù)據(jù)首部(header),稱為封裝(Encapsulation),如下圖所示:
?
不同的協(xié)議層對數(shù)據(jù)包有不同的稱謂,在傳輸層叫做段(segment),在網(wǎng)絡(luò)層叫做數(shù)據(jù)報(datagram),在鏈路層叫做幀(frame)。數(shù)據(jù)封裝成幀后發(fā)到傳輸介質(zhì)上,到達(dá)目的主機(jī)后每層協(xié)議再剝掉相應(yīng)的首部,最后將應(yīng)用層數(shù)據(jù)交給應(yīng)用程序處理。
上圖對應(yīng)兩臺計算機(jī)在同一網(wǎng)段中的情況,如果兩臺計算機(jī)在不同的網(wǎng)段中,那么數(shù)據(jù)從一臺計算機(jī)到另一臺計算機(jī)傳輸過程中要經(jīng)過一個或多個路由器,如下圖所示:
?
其實在鏈路層之下還有物理層,指的是電信號的傳遞方式,比如現(xiàn)在以太網(wǎng)通用的網(wǎng)線(雙絞線)、早期以太網(wǎng)采用的的同軸電纜(現(xiàn)在主要用于有線電視)、光纖等都屬于物理層的概念。物理層的能力決定了最大傳輸速率、傳輸距離、抗干擾性等。集線器(Hub)是工作在物理層的網(wǎng)絡(luò)設(shè)備,用于雙絞線的連接和信號中繼(將已衰減的信號再次放大使之傳得更遠(yuǎn))。
鏈路層有以太網(wǎng)、令牌環(huán)網(wǎng)等標(biāo)準(zhǔn),鏈路層負(fù)責(zé)網(wǎng)卡設(shè)備的驅(qū)動、幀同步(就是說從網(wǎng)線上檢測到什么信號算作新幀的開始)、沖突檢測(如果檢測到?jīng)_突就自動重發(fā))、數(shù)據(jù)差錯校驗等工作。交換機(jī)是工作在鏈路層的網(wǎng)絡(luò)設(shè)備,可以在不同的鏈路層網(wǎng)絡(luò)之間轉(zhuǎn)發(fā)數(shù)據(jù)幀(比如十兆以太網(wǎng)和百兆以太網(wǎng)之間、以太網(wǎng)和令牌環(huán)網(wǎng)之間),由于不同鏈路層的幀格式不同,交換機(jī)要將進(jìn)來的數(shù)據(jù)包拆掉鏈路層首部重新封裝之后再轉(zhuǎn)發(fā)。
網(wǎng)絡(luò)層的IP協(xié)議是構(gòu)成Internet的基礎(chǔ)。Internet上的主機(jī)通過IP地址來標(biāo)識,Internet上有大量路由器負(fù)責(zé)根據(jù)IP地址選擇合適的路徑轉(zhuǎn)發(fā)數(shù)據(jù)包,數(shù)據(jù)包從Internet上的源主機(jī)到目的主機(jī)往往要經(jīng)過十多個路由器。路由器是工作在第三層的網(wǎng)絡(luò)設(shè)備,同時兼有交換機(jī)的功能,可以在不同的鏈路層接口之間轉(zhuǎn)發(fā)數(shù)據(jù)包,因此路由器需要將進(jìn)來的數(shù)據(jù)包拆掉網(wǎng)絡(luò)層和鏈路層兩層首部并重新封裝。IP協(xié)議不保證傳輸?shù)目煽啃?#xff0c;數(shù)據(jù)包在傳輸過程中可能丟失,可靠性可以在上層協(xié)議或應(yīng)用程序中提供支持。
網(wǎng)絡(luò)層負(fù)責(zé)點到點(point-to-point)的傳輸(這里的“點”指主機(jī)或路由器),而傳輸層負(fù)責(zé)端到端(end-to-end)的傳輸(這里的“端”指源主機(jī)和目的主機(jī))。傳輸層可選擇TCP或UDP協(xié)議。TCP是一種面向連接的、可靠的協(xié)議,有點像打電話,雙方拿起電話互通身份之后就建立了連接,然后說話就行了,這邊說的話那邊保證聽得到,并且是按說話的順序聽到的,說完話掛機(jī)斷開連接。也就是說TCP傳輸?shù)碾p方需要首先建立連接,之后由TCP協(xié)議保證數(shù)據(jù)收發(fā)的可靠性,丟失的數(shù)據(jù)包自動重發(fā),上層應(yīng)用程序收到的總是可靠的數(shù)據(jù)流,通訊之后關(guān)閉連接。UDP協(xié)議不面向連接,也不保證可靠性,有點像寄信,寫好信放到郵筒里,既不能保證信件在郵遞過程中不會丟失,也不能保證信件是按順序寄到目的地的。使用UDP協(xié)議的應(yīng)用程序需要自己完成丟包重發(fā)、消息排序等工作。
目的主機(jī)收到數(shù)據(jù)包后,如何經(jīng)過各層協(xié)議棧最后到達(dá)應(yīng)用程序呢?整個過程如下圖所示:
?
以太網(wǎng)驅(qū)動程序首先根據(jù)以太網(wǎng)首部中的“上層協(xié)議”字段確定該數(shù)據(jù)幀的有效載荷(payload,指除去協(xié)議首部之外實際傳輸?shù)臄?shù)據(jù))是IP、ARP還是RARP協(xié)議的數(shù)據(jù)報,然后交給相應(yīng)的協(xié)議處理。假如是IP數(shù)據(jù)報,IP協(xié)議再根據(jù)IP首部中的“上層協(xié)議”字段確定該數(shù)據(jù)報的有效載荷是TCP、UDP、ICMP還是IGMP,然后交給相應(yīng)的協(xié)議處理。假如是TCP段或UDP段,TCP或UDP協(xié)議再根據(jù)TCP首部或UDP首部的“端口號”字段確定應(yīng)該將應(yīng)用層數(shù)據(jù)交給哪個用戶進(jìn)程。IP地址是標(biāo)識網(wǎng)絡(luò)中不同主機(jī)的地址,而端口號就是同一臺主機(jī)上標(biāo)識不同進(jìn)程的地址,IP地址和端口號合起來標(biāo)識網(wǎng)絡(luò)中唯一的進(jìn)程。
注意,雖然IP、ARP和RARP數(shù)據(jù)報都需要以太網(wǎng)驅(qū)動程序來封裝成幀,但是從功能上劃分,ARP和RARP屬于鏈路層,IP屬于網(wǎng)絡(luò)層。雖然ICMP、IGMP、TCP、UDP的數(shù)據(jù)都需要IP協(xié)議來封裝成數(shù)據(jù)報,但是從功能上劃分,ICMP、IGMP與IP同屬于網(wǎng)絡(luò)層,TCP和UDP屬于傳輸層。本文對RARP、ICMP、IGMP協(xié)議不做進(jìn)一步介紹,有興趣的讀者可以看參考資料。
以太網(wǎng)的幀格式如下所示
其中的源地址和目的地址是指網(wǎng)卡的硬件地址(也叫MAC地址),長度是48位,是在網(wǎng)卡出廠時固化的。用ifconfig命令看一下,“HWaddr 00:15:F2:14:9E:3F”部分就是硬件地址。類型字段有三種值,分別對應(yīng)IP、ARP、RARP。幀末尾是CRC校驗碼。
以太網(wǎng)幀中的數(shù)據(jù)長度規(guī)定最小46字節(jié),最大1500字節(jié),ARP和RARP數(shù)據(jù)包的長度不夠46字節(jié),要在后面補(bǔ)填充位。最大值1500稱為以太網(wǎng)的最大傳輸單元(MTU),不同的網(wǎng)絡(luò)類型有不同的MTU,如果一個數(shù)據(jù)包從以太網(wǎng)路由到撥號鏈路上,數(shù)據(jù)包長度大于撥號鏈路的MTU了,則需要對數(shù)據(jù)包進(jìn)行分片(fragmentation)。ifconfig命令的輸出中也有“MTU:1500”。注意,MTU這個概念指數(shù)據(jù)幀中有效載荷的最大長度,不包括幀首部的長度。
ARP數(shù)據(jù)報格式
??????????? 在網(wǎng)絡(luò)通訊時,源主機(jī)的應(yīng)用程序知道目的主機(jī)的IP地址和端口號,卻不知道目的主機(jī)的硬件地址,而數(shù)據(jù)包首先是被網(wǎng)卡接收到再去處理上層協(xié)議的,如果接收到的數(shù)據(jù)包的硬件地址與本機(jī)不符,則直接丟棄。因此在通訊前必須獲得目的主機(jī)的硬件地址。ARP協(xié)議就起到這個作用。
源主機(jī)發(fā)出ARP請求,詢問“IP地址是192.168.0.1的主機(jī)的硬件地址是多少”,并將這個請求廣播到本地網(wǎng)段(以太網(wǎng)幀首部的硬件地址填FF:FF:FF:FF:FF:FF表示廣播),目的主機(jī)接收到廣播的ARP請求,發(fā)現(xiàn)其中的IP地址與本機(jī)相符,則發(fā)送一個ARP應(yīng)答數(shù)據(jù)包給源主機(jī),將自己的硬件地址填寫在應(yīng)答包中。
每臺主機(jī)都維護(hù)一個ARP緩存表,可以用arp -a命令查看。緩存表中的表項有過期時間(一般為20分鐘),如果20分鐘內(nèi)沒有再次使用某個表項,則該表項失效,下次還要發(fā)ARP請求來獲得目的主機(jī)的硬件地址。想一想,為什么表項要有過期時間而不是一直有效?
ARP數(shù)據(jù)報的格式如下所示:
注意到源MAC地址、目的MAC地址在以太網(wǎng)首部和ARP請求中各出現(xiàn)一次,對于鏈路層為以太網(wǎng)的情況是多余的,但如果鏈路層是其它類型的網(wǎng)絡(luò)則有可能是必要的。硬件類型指鏈路層網(wǎng)絡(luò)類型,1為以太網(wǎng),協(xié)議類型指要轉(zhuǎn)換的地址類型,0x0800為IP地址,后面兩個地址長度對于以太網(wǎng)地址和IP地址分別為6和4(字節(jié)),op字段為1表示ARP請求,op字段為2表示ARP應(yīng)答。
下面舉一個具體的例子。
請求幀如下(為了清晰在每行的前面加了字節(jié)計數(shù),每行16個字節(jié)):
以太網(wǎng)首部(14字節(jié))?
0000: ff ff ff ff ff ff 00 05 5d 61 58 a8 08 06?
ARP幀(28字節(jié))?
0000:?????????????????????????????????????????? 00 01?
0010: 08 00 06 04 00 01 00 05 5d 61 58 a8 c0 a8 00 37?
0020: 00 00 00 00 00 00 c0 a8 00 02?
填充位(18字節(jié))?
0020:?????????????????????????????? 00 77 31 d2 50 10?
0030: fd 78 41 d3 00 00 00 00 00 00 00 00
以太網(wǎng)首部:目的主機(jī)采用廣播地址,源主機(jī)的MAC地址是00:05:5d:61:58:a8,上層協(xié)議類型0x0806表示ARP。
ARP幀:硬件類型0x0001表示以太網(wǎng),協(xié)議類型0x0800表示IP協(xié)議,硬件地址(MAC地址)長度為6,協(xié)議地址(IP地址)長度為4,op為0x0001表示請求目的主機(jī)的MAC地址,源主機(jī)MAC地址為00:05:5d:61:58:a8,源主機(jī)IP地址為c0 a8 00 37(192.168.0.55),目的主機(jī)MAC地址全0待填寫,目的主機(jī)IP地址為c0 a8 00 02(192.168.0.2)。
由于以太網(wǎng)規(guī)定最小數(shù)據(jù)長度為46字節(jié),ARP幀長度只有28字節(jié),因此有18字節(jié)填充位,填充位的內(nèi)容沒有定義,與具體實現(xiàn)相關(guān)。
應(yīng)答幀如下:
以太網(wǎng)首部?
0000: 00 05 5d 61 58 a8 00 05 5d a1 b8 40 08 06?
ARP幀?
0000:?????????????????????????????????????????? 00 01?
0010: 08 00 06 04 00 02 00 05 5d a1 b8 40 c0 a8 00 02?
0020: 00 05 5d 61 58 a8 c0 a8 00 37?
填充位?
0020:?????????????????????????????? 00 77 31 d2 50 10?
0030: fd 78 41 d3 00 00 00 00 00 00 00 00
以太網(wǎng)首部:目的主機(jī)的MAC地址是00:05:5d:61:58:a8,源主機(jī)的MAC地址是00:05:5d:a1:b8:40,上層協(xié)議類型0x0806表示ARP。
ARP幀:硬件類型0x0001表示以太網(wǎng),協(xié)議類型0x0800表示IP協(xié)議,硬件地址(MAC地址)長度為6,協(xié)議地址(IP地址)長度為4,op為0x0002表示應(yīng)答,源主機(jī)MAC地址為00:05:5d:a1:b8:40,源主機(jī)IP地址為c0 a8 00 02(192.168.0.2),目的主機(jī)MAC地址為00:05:5d:61:58:a8,目的主機(jī)IP地址為c0 a8 00 37(192.168.0.55)。
IP數(shù)據(jù)報格式
?
IP數(shù)據(jù)報的首部長度和數(shù)據(jù)長度都是可變長的,但總是4字節(jié)的整數(shù)倍。對于IPv4,4位版本字段是4。4位首部長度的數(shù)值是以4字節(jié)為單位的,最小值為5,也就是說首部長度最小是4x5=20字節(jié),也就是不帶任何選項的IP首部,4位能表示的最大值是15,也就是說首部長度最大是60字節(jié)。
?
8位TOS字段有3個位用來指定IP數(shù)據(jù)報的優(yōu)先級(目前已經(jīng)廢棄不用),還有4個位表示可選的服務(wù)類型(最小延遲、最大呑吐量、最大可靠性、最小成本),還有一個位總是0。總長度是整個數(shù)據(jù)報(包括IP首部和IP層payload)的字節(jié)數(shù)。每傳一個IP數(shù)據(jù)報,16位的標(biāo)識加1,可用于分片和重新組裝數(shù)據(jù)報。3位標(biāo)志和13位片偏移用于分片。TTL(Time to live)是這樣用的:源主機(jī)為數(shù)據(jù)包設(shè)定一個生存時間,比如64,每過一個路由器就把該值減1,如果減到0就表示路由已經(jīng)太長了仍然找不到目的主機(jī)的網(wǎng)絡(luò),就丟棄該包,因此這個生存時間的單位不是秒,而是跳(hop)。協(xié)議字段指示上層協(xié)議是TCP、UDP、ICMP還是IGMP。然后是校驗和,只校驗IP首部,數(shù)據(jù)的校驗由更高層協(xié)議負(fù)責(zé)。IPv4的IP地址長度為32位。選項字段的解釋從略。
?
IP地址與路由
IPv4的IP地址長度為4字節(jié),通常采用點分十進(jìn)制表示法(dotted decimal representation)例如0xc0a80002表示為192.168.0.2。
Internet被各種路由器和網(wǎng)關(guān)設(shè)備分隔成很多網(wǎng)段,為了標(biāo)識不同的網(wǎng)段,需要把32位的IP地址劃分成網(wǎng)絡(luò)號和主機(jī)號兩部分,網(wǎng)絡(luò)號相同的各主機(jī)位于同一網(wǎng)段,相互間可以直接通信,網(wǎng)絡(luò)號不同的主機(jī)之間通信則需要通過路由器轉(zhuǎn)發(fā)。
過去曾經(jīng)提出一種劃分網(wǎng)絡(luò)號和主機(jī)號的方案,把所有IP地址分為五類,如下圖所示:
A類 0.0.0.0到127.255.255.255?
B類 128.0.0.0到191.255.255.255?
C類 192.0.0.0到223.255.255.255?
D類 224.0.0.0到239.255.255.255?
E類 240.0.0.0到247.255.255.255
?
一個A類網(wǎng)絡(luò)可容納的地址數(shù)量最大,一個B類網(wǎng)絡(luò)的地址數(shù)量是65536,一個C類網(wǎng)絡(luò)的地址數(shù)量是256。D類地址用作多播地址,E類地址保留未用。
?
UDP段格式
下面分析一幀基于UDP的TFTP協(xié)議幀。
以太網(wǎng)首部?
0000: 00 05 5d 67 d0 b1 00 05 5d 61 58 a8 08 00??
IP首部?
0000:?????????????????????????????????????????? 45 00?
0010: 00 53 93 25 00 00 80 11 25 ec c0 a8 00 37 c0 a8?
0020: 00 01?
UDP首部?
0020:????? 05 d4 00 45 00 3f ac 40?
TFTP協(xié)議?
0020:?????????????????????????????? 00 01 'c'':''\''q'?
0030: 'w''e''r''q''.''q''w''e'00 'n''e''t''a''s''c''i'?
0040: 'i'00 'b''l''k''s''i''z''e'00 '5''1''2'00 't''i'?
0050: 'm''e''o''u''t'00 '1''0'00 't''s''i''z''e'00 '0'?
0060: 00
以太網(wǎng)首部:目的MAC地址是00:05:5d:67:d0:b1,源MAC地址是00:05:5d:61:58:a8,上層協(xié)議類型0x0800表示IP。
IP首部:第一個字節(jié)0x45包含4位版本號和4位首部長度,版本號為4,即IPv4,首部長度為5,說明IP首部不帶有選項字段。服務(wù)類型為0,沒有使用服務(wù)。16位總長度字段(包括IP首部和IP層payload的長度)為0x0053,即83字節(jié),加上以太網(wǎng)首部14字節(jié)可知整個幀長度是97字節(jié)。IP報標(biāo)識是0x9325,標(biāo)志字段和片偏移字段設(shè)置為0x0000,就是DF=0允許分片,MF=0此數(shù)據(jù)報沒有更多分片,沒有分片偏移。TTL是0x80,也就是128。上層協(xié)議0x11表示UDP協(xié)議。IP首部校驗和為0x25ec,源主機(jī)IP是c0 a8 00 37(192.168.0.55),目的主機(jī)IP是c0 a8 00 01(192.168.0.1)。
UDP首部:源端口號0x05d4(1492)是客戶端的端口號,目的端口號0x0045(69)是TFTP服務(wù)的well-known端口號。UDP報長度為0x003f,即63字節(jié),包括UDP首部和UDP層payload的長度。UDP首部和UDP層payload的校驗和為0xac40。
TFTP是基于文本的協(xié)議,各字段之間用字節(jié)0分隔,開頭的00 01表示請求讀取一個文件,接下來的各字段是:
c:\qwerq.qwe?
netascii?
blksize 512?
timeout 10?
tsize 0
一般的網(wǎng)絡(luò)通信都是像TFTP協(xié)議這樣,通信的雙方分別是客戶端和服務(wù)器,客戶端主動發(fā)起請求(上面的例子就是客戶端發(fā)起的請求幀),而服務(wù)器被動地等待、接收和應(yīng)答請求。客戶端的IP地址和端口號唯一標(biāo)識了該主機(jī)上的TFTP客戶端進(jìn)程,服務(wù)器的IP地址和端口號唯一標(biāo)識了該主機(jī)上的TFTP服務(wù)進(jìn)程,由于客戶端是主動發(fā)起請求的一方,它必須知道服務(wù)器的IP地址和TFTP服務(wù)進(jìn)程的端口號,所以,一些常見的網(wǎng)絡(luò)協(xié)議有默認(rèn)的服務(wù)器端口,例如HTTP服務(wù)默認(rèn)TCP協(xié)議的80端口,FTP服務(wù)默認(rèn)TCP協(xié)議的21端口,TFTP服務(wù)默認(rèn)UDP協(xié)議的69端口(如上例所示)。在使用客戶端程序時,必須指定服務(wù)器的主機(jī)名或IP地址,如果不明確指定端口號則采用默認(rèn)端口,請讀者查閱ftp、tftp等程序的man page了解如何指定端口號。/etc/services中列出了所有well-known的服務(wù)端口和對應(yīng)的傳輸層協(xié)議,這是由IANA(Internet Assigned Numbers Authority)規(guī)定的,其中有些服務(wù)既可以用TCP也可以用UDP,為了清晰,IANA規(guī)定這樣的服務(wù)采用相同的TCP或UDP默認(rèn)端口號,而另外一些TCP和UDP的相同端口號卻對應(yīng)不同的服務(wù)。
很多服務(wù)有well-known的端口號,然而客戶端程序的端口號卻不必是well-known的,往往是每次運行客戶端程序時由系統(tǒng)自動分配一個空閑的端口號,用完就釋放掉,稱為ephemeral的端口號,想想這是為什么。
前面提過,UDP協(xié)議不面向連接,也不保證傳輸?shù)目煽啃?#xff0c;例如:
-
發(fā)送端的UDP協(xié)議層只管把應(yīng)用層傳來的數(shù)據(jù)封裝成段交給IP協(xié)議層就算完成任務(wù)了,如果因為網(wǎng)絡(luò)故障該段無法發(fā)到對方,UDP協(xié)議層也不會給應(yīng)用層返回任何錯誤信息。
-
接收端的UDP協(xié)議層只管把收到的數(shù)據(jù)根據(jù)端口號交給相應(yīng)的應(yīng)用程序就算完成任務(wù)了,如果發(fā)送端發(fā)來多個數(shù)據(jù)包并且在網(wǎng)絡(luò)上經(jīng)過不同的路由,到達(dá)接收端時順序已經(jīng)錯亂了,UDP協(xié)議層也不保證按發(fā)送時的順序交給應(yīng)用層。
-
通常接收端的UDP協(xié)議層將收到的數(shù)據(jù)放在一個固定大小的緩沖區(qū)中等待應(yīng)用程序來提取和處理,如果應(yīng)用程序提取和處理的速度很慢,而發(fā)送端發(fā)送的速度很快,就會丟失數(shù)據(jù)包,UDP協(xié)議層并不報告這種錯誤。
因此,使用UDP協(xié)議的應(yīng)用程序必須考慮到這些可能的問題并實現(xiàn)適當(dāng)?shù)慕鉀Q方案,例如等待應(yīng)答、超時重發(fā)、為數(shù)據(jù)包編號、流量控制等。一般使用UDP協(xié)議的應(yīng)用程序?qū)崿F(xiàn)都比較簡單,只是發(fā)送一些對可靠性要求不高的消息,而不發(fā)送大量的數(shù)據(jù)。例如,基于UDP的TFTP協(xié)議一般只用于傳送小文件(所以才叫trivial的ftp),而基于TCP的FTP協(xié)議適用于各種文件的傳輸。下面看TCP協(xié)議如何用面向連接的服務(wù)來代替應(yīng)用程序解決傳輸?shù)目煽啃詥栴}。
?
TCP協(xié)議
和UDP協(xié)議一樣也有源端口號和目的端口號,通訊的雙方由IP地址和端口號標(biāo)識。32位序號、32位確認(rèn)序號、窗口大小稍后詳細(xì)解釋。4位首部長度和IP協(xié)議頭類似,表示TCP協(xié)議頭的長度,以4字節(jié)為單位,因此TCP協(xié)議頭最長可以是4x15=60字節(jié),如果沒有選項字段,TCP協(xié)議頭最短20字節(jié)。URG、ACK、PSH、RST、SYN、FIN是六個控制位,本節(jié)稍后將解釋SYN、ACK、FIN、RST四個位,其它位的解釋從略。16位檢驗和將TCP協(xié)議頭和數(shù)據(jù)都計算在內(nèi)。緊急指針和各種選項的解釋從略。
?
下圖是一次TCP通訊的時序圖。
圖 36.13. TCP連接建立斷開
在這個例子中,首先客戶端主動發(fā)起連接、發(fā)送請求,然后服務(wù)器端響應(yīng)請求,然后客戶端主動關(guān)閉連接。兩條豎線表示通訊的兩端,從上到下表示時間的先后順序,注意,數(shù)據(jù)從一端傳到網(wǎng)絡(luò)的另一端也需要時間,所以圖中的箭頭都是斜的。雙方發(fā)送的段按時間順序編號為1-10,各段中的主要信息在箭頭上標(biāo)出,例如段2的箭頭上標(biāo)著SYN, 8000(0), ACK 1001, <mss 1024>,表示該段中的SYN位置1,32位序號是8000,該段不攜帶有效載荷(數(shù)據(jù)字節(jié)數(shù)為0),ACK位置1,32位確認(rèn)序號是1001,帶有一個mss選項值為1024。
建立連接的過程:
客戶端發(fā)出段1,SYN位表示連接請求。序號是1000,這個序號在網(wǎng)絡(luò)通訊中用作臨時的地址,每發(fā)一個數(shù)據(jù)字節(jié),這個序號要加1,這樣在接收端可以根據(jù)序號排出數(shù)據(jù)包的正確順序,也可以發(fā)現(xiàn)丟包的情況,另外,規(guī)定SYN位和FIN位也要占一個序號,這次雖然沒發(fā)數(shù)據(jù),但是由于發(fā)了SYN位,因此下次再發(fā)送應(yīng)該用序號1001。mss表示最大段尺寸,如果一個段太大,封裝成幀后超過了鏈路層的最大幀長度,就必須在IP層分片,為了避免這種情況,客戶端聲明自己的最大段尺寸,建議服務(wù)器端發(fā)來的段不要超過這個長度。
服務(wù)器發(fā)出段2,也帶有SYN位,同時置ACK位表示確認(rèn),確認(rèn)序號是1001,表示“我接收到序號1000及其以前所有的段,請你下次發(fā)送序號為1001的段”,也就是應(yīng)答了客戶端的連接請求,同時也給客戶端發(fā)出一個連接請求,同時聲明最大尺寸為1024。
客戶端發(fā)出段3,對服務(wù)器的連接請求進(jìn)行應(yīng)答,確認(rèn)序號是8001。
在這個過程中,客戶端和服務(wù)器分別給對方發(fā)了連接請求,也應(yīng)答了對方的連接請求,其中服務(wù)器的請求和應(yīng)答在一個段中發(fā)出,因此一共有三個段用于建立連接,稱為'''三方握手(three-way-handshake)'''。在建立連接的同時,雙方協(xié)商了一些信息,例如雙方發(fā)送序號的初始值、最大段尺寸等。
在TCP通訊中,如果一方收到另一方發(fā)來的段,讀出其中的目的端口號,發(fā)現(xiàn)本機(jī)并沒有任何進(jìn)程使用這個端口,就會應(yīng)答一個包含RST位的段給另一方。例如,服務(wù)器并沒有任何進(jìn)程使用8080端口,我們卻用telnet客戶端去連接它,服務(wù)器收到客戶端發(fā)來的SYN段就會應(yīng)答一個RST段,客戶端的telnet程序收到RST段后報告錯誤Connection refused:
$ telnet 192.168.0.200 8080 Trying 192.168.0.200... telnet: Unable to connect to remote host: Connection refused數(shù)據(jù)傳輸?shù)倪^程:
客戶端發(fā)出段4,包含從序號1001開始的20個字節(jié)數(shù)據(jù)。
服務(wù)器發(fā)出段5,確認(rèn)序號為1021,對序號為1001-1020的數(shù)據(jù)表示確認(rèn)收到,同時請求發(fā)送序號1021開始的數(shù)據(jù),服務(wù)器在應(yīng)答的同時也向客戶端發(fā)送從序號8001開始的10個字節(jié)數(shù)據(jù),這稱為piggyback。
客戶端發(fā)出段6,對服務(wù)器發(fā)來的序號為8001-8010的數(shù)據(jù)表示確認(rèn)收到,請求發(fā)送序號8011開始的數(shù)據(jù)。
在數(shù)據(jù)傳輸過程中,ACK和確認(rèn)序號是非常重要的,應(yīng)用程序交給TCP協(xié)議發(fā)送的數(shù)據(jù)會暫存在TCP層的發(fā)送緩沖區(qū)中,發(fā)出數(shù)據(jù)包給對方之后,只有收到對方應(yīng)答的ACK段才知道該數(shù)據(jù)包確實發(fā)到了對方,可以從發(fā)送緩沖區(qū)中釋放掉了,如果因為網(wǎng)絡(luò)故障丟失了數(shù)據(jù)包或者丟失了對方發(fā)回的ACK段,經(jīng)過等待超時后TCP協(xié)議自動將發(fā)送緩沖區(qū)中的數(shù)據(jù)包重發(fā)。
這個例子只描述了最簡單的一問一答的情景,實際的TCP數(shù)據(jù)傳輸過程可以收發(fā)很多數(shù)據(jù)段,雖然典型的情景是客戶端主動請求服務(wù)器被動應(yīng)答,但也不是必須如此,事實上TCP協(xié)議為應(yīng)用層提供了全雙工(full-duplex)的服務(wù),雙方都可以主動甚至同時給對方發(fā)送數(shù)據(jù)。
如果通訊過程只能采用一問一答的方式,收和發(fā)兩個方向不能同時傳輸,在同一時間只允許一個方向的數(shù)據(jù)傳輸,則稱為'''半雙工(half-duplex)''',假設(shè)某種面向連接的協(xié)議是半雙工的,則只需要一套序號就夠了,不需要通訊雙方各自維護(hù)一套序號,想一想為什么。
關(guān)閉連接的過程:
客戶端發(fā)出段7,FIN位表示關(guān)閉連接的請求。
服務(wù)器發(fā)出段8,應(yīng)答客戶端的關(guān)閉連接請求。
服務(wù)器發(fā)出段9,其中也包含F(xiàn)IN位,向客戶端發(fā)送關(guān)閉連接請求。
客戶端發(fā)出段10,應(yīng)答服務(wù)器的關(guān)閉連接請求。
建立連接的過程是三方握手,而關(guān)閉連接通常需要4個段,服務(wù)器的應(yīng)答和關(guān)閉連接請求通常不合并在一個段中,因為有連接半關(guān)閉的情況,這種情況下客戶端關(guān)閉連接之后就不能再發(fā)送數(shù)據(jù)給服務(wù)器了,但是服務(wù)器還可以發(fā)送數(shù)據(jù)給客戶端,直到服務(wù)器也關(guān)閉連接為止,稍后會看到這樣的例子。
?
流量控制
?
介紹UDP時我們描述了這樣的問題:如果發(fā)送端發(fā)送的速度較快,接收端接收到數(shù)據(jù)后處理的速度較慢,而接收緩沖區(qū)的大小是固定的,就會丟失數(shù)據(jù)。TCP協(xié)議通過'''滑動窗口(Sliding Window)'''機(jī)制解決這一問題。看下圖的通訊過程。
圖 36.14. 滑動窗口
發(fā)送端發(fā)起連接,聲明最大段尺寸是1460,初始序號是0,窗口大小是4K,表示“我的接收緩沖區(qū)還有4K字節(jié)空閑,你發(fā)的數(shù)據(jù)不要超過4K”。接收端應(yīng)答連接請求,聲明最大段尺寸是1024,初始序號是8000,窗口大小是6K。發(fā)送端應(yīng)答,三方握手結(jié)束。
發(fā)送端發(fā)出段4-9,每個段帶1K的數(shù)據(jù),發(fā)送端根據(jù)窗口大小知道接收端的緩沖區(qū)滿了,因此停止發(fā)送數(shù)據(jù)。
接收端的應(yīng)用程序提走2K數(shù)據(jù),接收緩沖區(qū)又有了2K空閑,接收端發(fā)出段10,在應(yīng)答已收到6K數(shù)據(jù)的同時聲明窗口大小為2K。
接收端的應(yīng)用程序又提走2K數(shù)據(jù),接收緩沖區(qū)有4K空閑,接收端發(fā)出段11,重新聲明窗口大小為4K。
發(fā)送端發(fā)出段12-13,每個段帶1K數(shù)據(jù),段13同時還包含F(xiàn)IN位。
接收端應(yīng)答接收到的2K數(shù)據(jù)(6145-8192),再加上FIN位占一個序號8193,因此應(yīng)答序號是8194,連接處于半關(guān)閉狀態(tài),接收端同時聲明窗口大小為2K。
接收端的應(yīng)用程序提走2K數(shù)據(jù),接收端重新聲明窗口大小為4K。
接收端的應(yīng)用程序提走剩下的2K數(shù)據(jù),接收緩沖區(qū)全空,接收端重新聲明窗口大小為6K。
接收端的應(yīng)用程序在提走全部數(shù)據(jù)后,決定關(guān)閉連接,發(fā)出段17包含F(xiàn)IN位,發(fā)送端應(yīng)答,連接完全關(guān)閉。
上圖在接收端用小方塊表示1K數(shù)據(jù),實心的小方塊表示已接收到的數(shù)據(jù),虛線框表示接收緩沖區(qū),因此套在虛線框中的空心小方塊表示窗口大小,從圖中可以看出,隨著應(yīng)用程序提走數(shù)據(jù),虛線框是向右滑動的,因此稱為滑動窗口。
從這個例子還可以看出,發(fā)送端是一K一K地發(fā)送數(shù)據(jù),而接收端的應(yīng)用程序可以兩K兩K地提走數(shù)據(jù),當(dāng)然也有可能一次提走3K或6K數(shù)據(jù),或者一次只提走幾個字節(jié)的數(shù)據(jù),也就是說,應(yīng)用程序所看到的數(shù)據(jù)是一個整體,或說是一個流(stream),在底層通訊中這些數(shù)據(jù)可能被拆成很多數(shù)據(jù)包來發(fā)送,但是一個數(shù)據(jù)包有多少字節(jié)對應(yīng)用程序是不可見的,因此TCP協(xié)議是面向流的協(xié)議。而UDP是面向消息的協(xié)議,每個UDP段都是一條消息,應(yīng)用程序必須以消息為單位提取數(shù)據(jù),不能一次提取任意字節(jié)的數(shù)據(jù),這一點和TCP是很不同的。
?
參考自:http://learn.akae.cn/media/ch36.html
總結(jié)
以上是生活随笔為你收集整理的TCP IP基础知识的复习的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Rafy 框架-发布网页版用户手册
- 下一篇: android被逼学习布局管理器