日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Socket编程知识必学/SELECT 编程

發(fā)布時間:2023/12/10 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Socket编程知识必学/SELECT 编程 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
Select在Socket編程中還是比較重要的,可是對于初學(xué)Socket的人來說都不太愛用Select寫程序,他們只是習(xí)慣寫諸如 connect、accept、recv或recvfrom這樣的阻塞程序(所謂阻塞方式block,顧名思義,就是進(jìn)程或是線程執(zhí)行到這些函數(shù)時必須等待某個事件的發(fā)生,如果事件沒有發(fā)生,進(jìn)程或線程就被阻塞,函數(shù)不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non- block,就是進(jìn)程或線程執(zhí)行此函數(shù)時不必非要等待事件的發(fā)生,一旦執(zhí)行肯定返回,以返回值的不同來反映函數(shù)的執(zhí)行情況,如果事件發(fā)生則與阻塞方式相同,若事件沒有發(fā)生則返回一個代碼來告知事件未發(fā)生,而進(jìn)程或線程繼續(xù)執(zhí)行,所以效率較高)方式工作的程序,它能夠監(jiān)視我們需要監(jiān)視的文件描述符的變化情況讀寫或是異常。下面詳細(xì)介紹一下!

Select的函數(shù)格式(我所說的是Unix系統(tǒng)下的伯克利socket編程,和windows下的有區(qū)別,一會兒說明):

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

先說明兩個結(jié)構(gòu)體:

第一,struct fd_set可以理解為一個集合,這個集合中存放的是文件描述符(file descriptor),即文件句柄,這可以是我們所說的普通意義的文件,當(dāng)然Unix下任何設(shè)備、管道、FIFO等都是文件形式,全部包括在內(nèi),所以毫無疑問一個socket就是一個文件,socket句柄就是一個文件描述符。fd_set集合可以通過一些宏由人為來操作,比如清空集合 FD_ZERO(fd_set *),將一個給定的文件描述符加入集合之中FD_SET(int ,fd_set *),將一個給定的文件描述符從集合中刪除FD_CLR(int ,fd_set*),檢查集合中指定的文件描述符是否可以讀寫FD_ISSET(int ,fd_set* )。一會兒舉例說明。

第二,struct timeval是一個大家常用的結(jié)構(gòu),用來代表時間值,有兩個成員,一個是秒數(shù),另一個是毫秒數(shù)。

具體解釋select的參數(shù):

int maxfdp是一個整數(shù)值,是指集合中所有文件描述符的范圍,即所有文件描述符的最大值加1,不能錯!在Windows中這個參數(shù)的值無所謂,可以設(shè)置不正確。

fd_set *readfds是指向fd_set結(jié)構(gòu)的指針,這個集合中應(yīng)該包括文件描述符,我們是要監(jiān)視這些文件描述符的讀變化的,即我們關(guān)心是否可以從這些文件中讀取數(shù)據(jù)了,如果這個集合中有一個文件可讀,select就會返回一個大于0的值,表示有文件可讀,如果沒有可讀的文件,則根據(jù)timeout參數(shù)再判斷是否超時,若超出timeout的時間,select返回0,若發(fā)生錯誤返回負(fù)值。可以傳入NULL值,表示不關(guān)心任何文件的讀變化。

fd_set *writefds是指向fd_set結(jié)構(gòu)的指針,這個集合中應(yīng)該包括文件描述符,我們是要監(jiān)視這些文件描述符的寫變化的,即我們關(guān)心是否可以向這些文件中寫入數(shù)據(jù)了,如果這個集合中有一個文件可寫,select就會返回一個大于0的值,表示有文件可寫,如果沒有可寫的文件,則根據(jù)timeout參數(shù)再判斷是否超時,若超出timeout的時間,select返回0,若發(fā)生錯誤返回負(fù)值。可以傳入NULL值,表示不關(guān)心任何文件的寫變化。

fd_set *errorfds同上面兩個參數(shù)的意圖,用來監(jiān)視文件錯誤異常。

struct timeval* timeout是select的超時時間,這個參數(shù)至關(guān)重要,它可以 使select處于三種狀態(tài)第一若將NULL以形參傳入,即不傳入時間結(jié)構(gòu),就是將select置于阻塞狀態(tài),一定等到監(jiān)視文件描述符集合中某個文件描述符發(fā)生變化為止第二若將時間值設(shè)為0秒0毫秒,就變成一個純粹的非阻塞函數(shù),不管文件描述符是否有變化,都立刻返回繼續(xù)執(zhí)行,文件無變化返回0,有變化返回一個正值 第三, timeout的值大于0,這就是等待的超時時間,即 select在timeout時間內(nèi)阻塞,超時時間之內(nèi)有事件到來就返回了,否則在超時后不管怎樣一定返回,返回值同上述。

返回值:

負(fù)值:select錯誤 正值:某些文件可讀寫或出錯 0:等待超時,沒有可讀寫或錯誤的文件

在有了select后可以寫出像樣的網(wǎng)絡(luò)程序來!舉個簡單的例子,就是從網(wǎng)絡(luò)上接受數(shù)據(jù)寫入一個文件中。

例子:

main()

{

int sock;

FILE *fp;

struct fd_set fds;

struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0

char buffer[256]={0}; //256字節(jié)的接收緩沖區(qū)

/* 假定已經(jīng)建立UDP連接,具體過程不寫,簡單,當(dāng)然TCP也同理,主機ip和port都已經(jīng)給定,要寫的文件已經(jīng)打開

sock=socket(...);

bind(...);

fp=fopen(...); */

while(1)

{

FD_ZERO(&fds); //每次循環(huán)都要清空集合,否則不能檢測描述符變化

FD_SET(sock,&fds); //添加描述符

FD_SET(fp,&fds); //同上

maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1

switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用

{

case -1: exit(-1);break; //select錯誤,退出程序

case 0:break; //再次輪詢

default:

if(FD_ISSET(sock,&fds)) //測試sock是否可讀,即是否網(wǎng)絡(luò)上有數(shù)據(jù)

{

recvfrom(sock,buffer,256,.....);//接受網(wǎng)絡(luò)數(shù)據(jù)

if(FD_ISSET(fp,&fds)) //測試文件是否可寫

fwrite(fp,buffer...);//寫入文件

buffer清空;

}// end if break;

}// end switch

}//end while

}//end main

----------------------------------------------------------
Linux select()詳解


Linux select()詳解 ? ??? select系統(tǒng)調(diào)用是用來讓我們的程序監(jiān)視多個文件句柄(file descriptor)的狀態(tài)變化的。程序會停在select這里等待,直到被監(jiān)視的文件句柄有某一個或多個發(fā)生了狀態(tài)改變。

??? 文件在句柄在Linux里很多,如果你man某個函數(shù),在函數(shù)返回值部分說到成功后有一個文件句柄被創(chuàng)建的都是的,如man socket可以看到“On success, a file descriptor for the new socket is returned.”而man 2 open可以看到“open() and creat() return the new file descriptor”,其實文件句柄就是一個整數(shù),看socket函數(shù)的聲明就明白了:
??? int socket(int domain, int type, int protocol);
當(dāng)然,我們最熟悉的句柄是0、1、2三個,0是標(biāo)準(zhǔn)輸入,1是標(biāo)準(zhǔn)輸出,2是標(biāo)準(zhǔn)錯誤輸出。0、1、2是整數(shù)表示的,對應(yīng)的FILE *結(jié)構(gòu)的表示就是stdin、stdout、stderr,0就是stdin,1就是stdout,2就是stderr。
比如下面這兩段代碼都是從標(biāo)準(zhǔn)輸入讀入9個字節(jié)字符:


#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
??????? char buf[10] = "";
??????? read(0, buf, 9); /* 從標(biāo)準(zhǔn)輸入 0 讀入字符 */
??????? fprintf(stdout, "%s\n", buf); /* 向標(biāo)準(zhǔn)輸出 stdout 寫字符 */
??????? return 0;
}
/* **上面和下面的代碼都可以用來從標(biāo)準(zhǔn)輸入讀用戶輸入的9個字符** */
#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
??????? char buf[10] = "";
??????? fread(buf, 9, 1, stdin); /* 從標(biāo)準(zhǔn)輸入 stdin 讀入字符 */
??????? write(1, buf, strlen(buf));
??????? return 0;
}
?? 繼續(xù)上面說的 select,就是用來監(jiān)視某個或某些句柄的狀態(tài)變化的。select函數(shù)原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
函數(shù)的最后一個參數(shù)timeout顯然是一個超時時間值,其類型是struct timeval *,即一個struct timeval結(jié)構(gòu)的變量的指針,所以我們在程序里要申明一個struct timeval tv;然后把變量tv的地址&tv傳遞給select函數(shù)。struct timeval結(jié)構(gòu)如下:


struct timeval {
???????????? long??? tv_sec;???????? /* seconds */
???????????? long??? tv_usec;??????? /* microseconds */
???????? };
?? 第2、3、4三個參數(shù)是一樣的類型: fd_set *,即我們在程序里要申明幾個fd_set類型的變量,比如rdfds, wtfds, exfds,然后把這個變量的地址&rdfds, &wtfds, &exfds 傳遞給select函數(shù)。這三個參數(shù)都是一個句柄的集合,第一個rdfds是用來保存這樣的句柄的:當(dāng)句柄的狀態(tài)變成可讀的時系統(tǒng)就會告訴select函數(shù)返回,同理第二個wtfds是指有句柄狀態(tài)變成可寫的時系統(tǒng)就會告訴select函數(shù)返回,同理第三個參數(shù)exfds是特殊情況,即句柄上有特殊情況發(fā)生時系統(tǒng)會告訴select函數(shù)返回。特殊情況比如對方通過一個socket句柄發(fā)來了緊急數(shù)據(jù)。如果我們程序里只想檢測某個socket是否有數(shù)據(jù)可讀,我們可以這樣:

fd_set rdfds; /* 先申明一個 fd_set 集合來保存我們要檢測的 socket句柄 */
struct timeval tv; /* 申明一個時間變量來保存時間 */
int ret; /* 保存返回值 */
FD_ZERO(&rdfds); /* 用select函數(shù)之前先把集合清零 */
FD_SET(socket, &rdfds); /* 把要檢測的句柄socket加入到集合里 */
tv.tv_sec = 1;
tv.tv_usec = 500; /* 設(shè)置select等待的最大時間為1秒加500毫秒 */
ret = select(socket + 1, &rdfds, NULL, NULL, &tv); /* 檢測我們上面設(shè)置到集合rdfds里的句柄是否有可讀信息 */
if(ret < 0) perror("select");/* 這說明select函數(shù)出錯 */
else if(ret == 0) printf("超時\n"); /* 說明在我們設(shè)定的時間值1秒加500毫秒的時間內(nèi),socket的狀態(tài)沒有發(fā)生變化 */
else { /* 說明等待時間還未到1秒加500毫秒,socket的狀態(tài)發(fā)生了變化 */
??? printf("ret=%d\n", ret); /* ret這個返回值記錄了發(fā)生狀態(tài)變化的句柄的數(shù)目,由于我們只監(jiān)視了socket這一個句柄,所以這里一定ret=1,如果同時有多個句柄發(fā)生變化返回的就是句柄的總和了 */
??? /* 這里我們就應(yīng)該從socket這個句柄里讀取數(shù)據(jù)了,因為select函數(shù)已經(jīng)告訴我們這個句柄里有數(shù)據(jù)可讀 */
??? if(FD_ISSET(socket, &rdfds)) { /* 先判斷一下socket這外被監(jiān)視的句柄是否真的變成可讀的了 */
??????? /* 讀取socket句柄里的數(shù)據(jù) */
??????? recv(...);
??? }
}
?? 注意select函數(shù)的第一個參數(shù),是所有加入集合的句柄值的最大那個值還要加1。比如我們創(chuàng)建了3個句柄:
/************關(guān)于本文檔********************************************
*filename: Linux網(wǎng)絡(luò)編程一步一步學(xué)-select詳解
*purpose: 詳細(xì)說明select的用法
*wrote by: zhoulifa( zhoulifa@163.com) 周立發(fā)( http://zhoulifa.bokee.com)
Linux愛好者 Linux知識傳播者 SOHO族 開發(fā)者 最擅長C語言
*date time:2007-02-03 19:40
*Note: 任何人可以任意復(fù)制代碼并運用這些文檔,當(dāng)然包括你的商業(yè)用途
* 但請遵循GPL
*Thanks to:Google
*Hope:希望越來越多的人貢獻(xiàn)自己的力量,為科學(xué)技術(shù)發(fā)展出力
* 科技站在巨人的肩膀上進(jìn)步更快!感謝有開源前輩的貢獻(xiàn)!
*********************************************************************/

int sa, sb, sc;
sa = socket(...); /* 分別創(chuàng)建3個句柄并連接到服務(wù)器上 */
connect(sa,...);
sb = socket(...);
connect(sb,...);
sc = socket(...);
connect(sc,...);

FD_SET(sa, &rdfds);/* 分別把3個句柄加入讀監(jiān)視集合里去 */
FD_SET(sb, &rdfds);
FD_SET(sc, &rdfds);
?? 在使用select函數(shù)之前,一定要找到3個句柄中的最大值是哪個,我們一般定義一個變量來保存最大值,取得最大socket值如下:

int maxfd = 0;
if(sa > maxfd) maxfd = sa;
if(sb > maxfd) maxfd = sb;
if(sc > maxfd) maxfd = sc;
?? 然后調(diào)用select函數(shù):
ret = select(maxfd + 1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
?? 同樣的道理,如果我們要檢測用戶是否按了鍵盤進(jìn)行輸入,我們就應(yīng)該把標(biāo)準(zhǔn)輸入0這個句柄放到select里來檢測,如下:

FD_ZERO(&rdfds);
FD_SET(0, &rdfds);
tv.tv_sec = 1;
tv.tv_usec = 0;
ret = select(1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
if(ret < 0) perror("select");/* 出錯 */
else if(ret == 0) printf("超時\n"); /* 在我們設(shè)定的時間tv內(nèi),用戶沒有按鍵盤 */
else { /* 用戶有按鍵盤,要讀取用戶的輸入 */
??? scanf("%s", buf);
}----------------------------------------------------------
Linux select學(xué)習(xí)筆記

select系統(tǒng)調(diào)用是用來讓我們的程序監(jiān)視多個文件描述符(file descrīptor)的狀態(tài)變化的。程序會停在select這里等待,直到被監(jiān)視的文件描述符有某一個或多個發(fā)生了狀態(tài)改變。select()的機制中提供一fd_set的數(shù)據(jù)結(jié)構(gòu),實際上是一long類型的數(shù)組, 每一個數(shù)組元素都能與一打開的文件描述符(不管是Socket描述符,還是其他 文件或命名管道或設(shè)備描述符)建立聯(lián)系,建立聯(lián)系的工作由程序員完成, 當(dāng)調(diào)用select()時,由內(nèi)核根據(jù)IO狀態(tài)修改fd_set的內(nèi)容,由此來通知執(zhí) 行了select()的進(jìn)程哪一Socket或文件可讀

select函數(shù)原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

函數(shù)的最后一個參數(shù)timeout顯然是一個超時時間值,其類型是struct timeval *,即一個struct timeval結(jié)構(gòu)的變量的指針,所以我們在程序里要申明一個struct timeval tv;然后把變量tv的地址&tv傳遞給select函數(shù)。struct timeval結(jié)構(gòu)如下:

struct timeval {
long? ?tv_sec;??? ?/* seconds */
long? ?tv_usec;??? /* microseconds */
};

第2、3、4三個參數(shù)的類型是一樣的: fd_set *,即我們在程序里要申明幾個fd_set類型的變量,比如定義了rfds, wfds, efds。

另外關(guān)于fd_set類型的變量,還有一組標(biāo)準(zhǔn)的宏定義來處理此類變量:

FD_ZERO(fd_set *fdset):清空fdset與所有文件描述符的聯(lián)系。

FD_SET(int fd, fd_set *fdset):建立文件描述符fd與fdset的聯(lián)系

FD_CLR(int fd, fd_set *fdset):清除文件描述符fd與fdset的聯(lián)系。

FD_ISSET(int fd, fd_set *fdset):檢查fd_set聯(lián)系的文件描述符fd是否可讀寫,>0表示可讀寫

(關(guān)于fd_set及相關(guān)宏的定義見/usr/include/sys/types.h)定義的這三個參數(shù)都是描述符的集合,第一個rfds是用來保存這樣的描述符的:當(dāng)描述符的狀態(tài)變成可讀的時系統(tǒng)就會告訴select函數(shù)返回,第二個wfds是指有描述符狀態(tài)變成可寫的時系統(tǒng)就會告訴select函數(shù)返回,第三個參數(shù)efds是特殊情況,即描述符上有特殊情況發(fā)生時系統(tǒng)會告訴select函數(shù)返回。下面以一個輸入為例來說明:

int fd1, fd2;???????? /* 在定義兩個描述符*/

fd1 = socket(...); ???/* 創(chuàng)建socket連接*/

fd2 = open(“/dev/tyS0”,O_RDWR); /* 打開一個串口*/

FD_ZERO(&rfds); ??????/* 用select函數(shù)之前先把集合清零 */

FD_SET(fd1, &rfds);?? /* 分別把2個描述符加入讀監(jiān)視集合里去 */

FD_SET(fd2, &rfds);

int maxfd = 0;

maxfd = (fd1>fd2)?(fd1+1):(fd2+1); ??????????/* 注意是最大值還要加1 */

ret = select(maxfd, &rfds, NULL, NULL, &tv); /*然后調(diào)用select函數(shù)*/

這樣就可以使用一個開關(guān)語句(switch語句)來判斷到底是哪一個輸入源在輸入數(shù)據(jù)。具體判斷如下:

switch(ret){

case -1:perror("select");/* 這說明select函數(shù)出錯 */

case 0:printf("超時\n"); /* 說明在設(shè)定的時間內(nèi),socket的狀態(tài)沒有發(fā)生變化 */

default:

if(FD_ISSET(fd1, &rfds)) 處理函數(shù)1();/*socket有數(shù)據(jù)來*/

if(FD_ISSET(fd2, &rfds)) 處理函數(shù)2();/*ttyS0有數(shù)據(jù)來*/

}

?

以下來自網(wǎng)絡(luò)搜索:

Linux下select調(diào)用的過程:

1.用戶層應(yīng)用程序調(diào)用select(),底層調(diào)用poll())

2.核心層調(diào)用sys_select() ------> do_select()

最終調(diào)用文件描述符fd對應(yīng)的struct file類型變量的struct file_operations *f_op的poll函數(shù)。

poll指向的函數(shù)返回當(dāng)前可否讀寫的信息。

1)如果當(dāng)前可讀寫,返回讀寫信息。

2)如果當(dāng)前不可讀寫,則阻塞進(jìn)程,并等待驅(qū)動程序喚醒,重新調(diào)用poll函數(shù),或超時返回。

3.驅(qū)動需要實現(xiàn)poll函數(shù)。

當(dāng)驅(qū)動發(fā)現(xiàn)有數(shù)據(jù)可以讀寫時,通知核心層,核心層重新調(diào)用poll指向的函數(shù)查詢信息。

poll_wait(filp,&wait_q,wait) // 此處將當(dāng)前進(jìn)程加入到等待隊列中,但并不阻塞

在中斷中使用wake_up_interruptible(&wait_q)喚醒等待隊列



----------------------------------------------------------
Socket編程中select()的妙用
?
用過 WinSock API 網(wǎng)友們知道:WinSock 編程中有一很方便的地方便是其
息驅(qū)動機制,不管是底層 API 的 WSAAsyncSelect() 還是 MFC 的異步Socket類:
CAsyncSocket,都提供了諸如 FD_ACCEPT、FD_READ、FD_CLOSE 之類的消息
供編程人員捕捉并處理。FD_ACCEPT 通知進(jìn)程有客戶方Socket請求連接,
FD_READ通知進(jìn)程本地Socket有東東可讀,FD_CLOSE通知進(jìn)程對方Socket已
關(guān)閉。那么,BSD Socket 是不是真的相形見拙呢?
?
非也! 'cause cpu love unix so.
?
BSD UNIX中有一系統(tǒng)調(diào)用芳名select()完全可以提供類似的消息驅(qū)動機制。
cpu鄭重宣布:WinSock的WSAAsyncSeclet()不過是此select()的fork版!
?
bill也是fork出來的嘛,xixi.
?
select()的機制中提供一fd_set的數(shù)據(jù)結(jié)構(gòu),實際上是一long類型的數(shù)組,
每一個數(shù)組元素都能與一打開的文件句柄(不管是Socket句柄,還是其他
文件或命名管道或設(shè)備句柄)建立聯(lián)系,建立聯(lián)系的工作由程序員完成,
當(dāng)調(diào)用select()時,由內(nèi)核根據(jù)IO狀態(tài)修改fd_set的內(nèi)容,由此來通知執(zhí)
行了select()的進(jìn)程哪一Socket或文件可讀,下面具體解釋:
?
#include? <sys/types.h>
#include? <sys/times.h>
#include? <sys/select.h>
?
int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;
?
ndfs:select監(jiān)視的文件句柄數(shù),視進(jìn)程中打開的文件數(shù)而定,一般設(shè)為呢要監(jiān)視各文件
????? 中的最大文件號加一。
readfds:select監(jiān)視的可讀文件句柄集合。
writefds: select監(jiān)視的可寫文件句柄集合。
exceptfds:select監(jiān)視的異常文件句柄集合。
timeout:本次select()的超時結(jié)束時間。(見/usr/sys/select.h,
??????? 可精確至百萬分之一秒!)
?
當(dāng)readfds或writefds中映象的文件可讀或可寫或超時,本次select()
就結(jié)束返回。程序員利用一組系統(tǒng)提供的宏在select()結(jié)束時便可判
斷哪一文件可讀或可寫。對Socket編程特別有用的就是readfds。
幾只相關(guān)的宏解釋如下:
?
FD_ZERO(fd_set *fdset):清空fdset與所有文件句柄的聯(lián)系。
FD_SET(int fd, fd_set *fdset):建立文件句柄fd與fdset的聯(lián)系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd與fdset的聯(lián)系。
FD_ISSET(int fd, fdset *fdset):檢查fdset聯(lián)系的文件句柄fd是否
??????????????????????????????? 可讀寫,>0表示可讀寫。
(關(guān)于fd_set及相關(guān)宏的定義見/usr/include/sys/types.h)
?
這樣,你的socket只需在有東東讀的時候才讀入,大致如下:
?
...
int???? sockfd;
fd_set? fdR;
struct? timeval timeout = ..;
...
for(;;) {
??????? FD_ZERO(&fdR);
??????? FD_SET(sockfd, &fdR);
??????? switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
??????????????? case -1:
??????????????????????? error handled by u;
??????????????? case 0:
??????????????????????? timeout hanled by u;
??????????????? default:
??????????????????????? if (FD_ISSET(sockfd)) {
??????????????????????????????? now u read or recv something;
??????????????????????????????? /* if sockfd is father and?
??????????????????????????????? server socket, u can now
??????????????????????????????? accept() */
??????????????????????? }
??????? }
}
?
所以一個FD_ISSET(sockfd)就相當(dāng)通知了sockfd可讀。
至于struct timeval在此的功能,請man select。不同的timeval設(shè)置
使使select()表現(xiàn)出超時結(jié)束、無超時阻塞和輪詢?nèi)N特性。由于
timeval可精確至百萬分之一秒,所以Windows的SetTimer()根本不算
什么。你可以用select()做一個超級時鐘。
?
FD_ACCEPT的實現(xiàn)?依然如上,因為客戶方socket請求連接時,會發(fā)送
連接請求報文,此時select()當(dāng)然會結(jié)束,FD_ISSET(sockfd)當(dāng)然大
于零,因為有報文可讀嘛!至于這方面的應(yīng)用,主要在于服務(wù)方的父
Socket,你若不喜歡主動accept(),可改為如上機制來accept()。
?
至于FD_CLOSE的實現(xiàn)及處理,頗費了一堆cpu處理時間,未完待續(xù)。
?
--
討論關(guān)于利用select()檢測對方Socket關(guān)閉的問題:
?
仍然是本地Socket有東東可讀,因為對方Socket關(guān)閉時,會發(fā)一個關(guān)閉連接
通知報文,會馬上被select()檢測到的。關(guān)于TCP的連接(三次握手)和關(guān)
閉(二次握手)機制,敬請參考有關(guān)TCP/IP的書籍。
?
不知是什么原因,UNIX好象沒有提供通知進(jìn)程關(guān)于Socket或Pipe對方關(guān)閉的
信號,也可能是cpu所知有限。總之,當(dāng)對方關(guān)閉,一執(zhí)行recv()或read(),
馬上回返回-1,此時全局變量errno的值是115,相應(yīng)的sys_errlist[errno]
為"Connect refused"(請參考/usr/include/sys/errno.h)。所以,在上
篇的for(;;)...select()程序塊中,當(dāng)有東西可讀時,一定要檢查recv()或
read()的返回值,返回-1時要作出關(guān)斷本地Socket的處理,否則select()會
一直認(rèn)為有東西讀,其結(jié)果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢
查recv()返回結(jié)果,且將收到的東東(實際沒收到)寫至標(biāo)準(zhǔn)輸出...
在有名管道的編程中也有類似問題出現(xiàn)。具體處理詳見拙作:發(fā)布一個有用
的Socket客戶方原碼。
?
至于主動寫Socket時對方突然關(guān)閉的處理則可以簡單地捕捉信號SIGPIPE并作
出相應(yīng)關(guān)斷本地Socket等等的處理。SIGPIPE的解釋是:寫入無讀者方的管道。
在此不作贅述,請詳man signal。
?
以上是cpu在作tcp/ip數(shù)據(jù)傳輸實驗積累的經(jīng)驗,若有錯漏,請狂炮擊之。
?
唉,昨天在hacker區(qū)被一幫孫子轟得差點兒沒短路。ren cpu(奔騰的心) z80
?
補充關(guān)于select在異步(非阻塞)connect中的應(yīng)用,剛開始搞socket編程的時候
我一直都用阻塞式的connect,非阻塞connect的問題是由于當(dāng)時搞proxy scan
而提出的呵呵
通過在網(wǎng)上與網(wǎng)友們的交流及查找相關(guān)FAQ,總算知道了怎么解決這一問題.同樣
用select可以很好地解決這一問題.大致過程是這樣的:
?
1.將打開的socket設(shè)為非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完
成(有的系統(tǒng)用FNEDLAY也可).
?
2.發(fā)connect調(diào)用,這時返回-1,但是errno被設(shè)為EINPROGRESS,意即connect仍舊
在進(jìn)行還沒有完成.
?
3.將打開的socket設(shè)進(jìn)被監(jiān)視的可寫(注意不是可讀)文件集合用select進(jìn)行監(jiān)視,
如果可寫,用
??????? getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
來得到error的值,如果為零,則connect成功.
?
在許多unix版本的proxyscan程序你都可以看到類似的過程,另外在solaris精華
區(qū)->編程技巧中有一個通用的帶超時參數(shù)的connect模塊.?

?

?

?

?

端口號常識:
? ? 端口號被從1 開始分配。
? ? 通常端口號超出255 的部分被本地主機保留為私有用途。
? ? 1到255 之間的號碼被用于遠(yuǎn)程應(yīng)用程序所請求的進(jìn)程和網(wǎng)絡(luò)服務(wù)。
? ? 每個網(wǎng)絡(luò)通信循環(huán)地進(jìn)出主計算機的TCP 應(yīng)用層。它被兩個所連接的號碼唯一地識別。這兩個號碼合起來叫做套接字.
? ?? ???組成套接字的這兩個號碼就是機器的IP 地址和TCP 軟件所使用的端口號。
套接字的三種類型
? ? 流式套接字(SOCK_STREAM),數(shù)據(jù)報套接字(SOCK_DGRAM)及原始套接字(RAW)。
??流式套接字(SOCK_STREAM)
? ? 流式的套接字可以提供可靠的、面向連接的通訊流。
? ? 如果你通過流式套接字發(fā)送了順序的數(shù)據(jù):“1”、“2”。那么數(shù)據(jù)到達(dá)遠(yuǎn)程時候的順序也是“1”、“2”。
? ? Telnet 應(yīng)用程序、BBS服務(wù)、以及系統(tǒng)的遠(yuǎn)程登陸都是通過Telnet 協(xié)議連接的。Telnet 就是一個流式連接。你是否希望你在Telnet 應(yīng)用程序上輸入的字符(或漢字)在到達(dá)遠(yuǎn)程應(yīng)用程序的時候是以你輸入的順序到達(dá)的?答案應(yīng)該是肯定的吧。
? ? 還有WWW 瀏覽器,它使用的HTTP 協(xié)議也是通過流式套接字來獲取網(wǎng)頁的。事實上,如果你Telnet 到一個Web Site 的80 端口上,然后輸入 “GET 網(wǎng)頁路徑名”然后按兩下回車(或者是兩下Ctrl+回車)然后你就得到了“網(wǎng)頁路徑名”所代表的網(wǎng)頁!
??數(shù)據(jù)報套接字(SOCK_DGRAM)
? ? 數(shù)據(jù)報套接字定義了一種無連接的服務(wù),數(shù)據(jù)通過相互獨立的報文進(jìn)行傳輸,是無序的,并且不保證可靠,無差錯。
? ?? ? 如果你發(fā)送了一個數(shù)據(jù)報,它可能不會到達(dá)。
? ?? ? 它可能會以不同的順序到達(dá)。
? ?? ? 如果它到達(dá)了,它包含的數(shù)據(jù)中可能存在錯誤。
? ?? ? 數(shù)據(jù)報套接字也使用IP,但是它不使用TCP,它使用使用者數(shù)據(jù)報協(xié)議UDP(User Datagram Protocol 可以參考RFC 768)
? ?為什么說它們是“無連接”的呢?因為它(UDP)不像流式套接字那樣維護(hù)一個打開的連接,你只需要把數(shù)據(jù)打成一個包,把遠(yuǎn)程的IP 貼上去,然后把這個包發(fā)送出去。這個過程是不需要建立連接的。
? ?? ? UDP 的應(yīng)用例子有: tftp, bootp 等。
? ?那么,數(shù)據(jù)包既然會丟失,怎樣能保證程序能夠正常工作呢?
? ?? ? 事實上,每個使用UDP的程序都要有自己的對數(shù)據(jù)進(jìn)行確認(rèn)的協(xié)議。
? ?? ?? ???比如, TFTP 協(xié)議定義了對于每一個發(fā)送出去的數(shù)據(jù)包,遠(yuǎn)程在接受到之后都要回送一個數(shù)據(jù)包告訴本地程序:“我已經(jīng)拿到了!”(一個 “ACK” 包)。如果數(shù)據(jù)包發(fā)的送者在5 秒內(nèi)沒有的得到回應(yīng),它就會重新發(fā)送這個數(shù)據(jù)包直到數(shù)據(jù)包接受者回送了 “ACK” 信號。這些知識對編寫一個使用UDP 協(xié)議的程序員來說是非常必要的。
? ?無連接服務(wù)器一般都是面向事務(wù)處理的,一個請求一個應(yīng)答就完成了客戶程序與服務(wù)程序之間的相互作用。
? ?面向連接服務(wù)器處理的請求往往比較復(fù)雜,不是一來一去的請求應(yīng)答所能解決的,而且往往是并發(fā)服務(wù)器
? ?套接字工作過程如下:
? ?? ?? ?服務(wù)器首先啟動
? ?? ?? ?通過調(diào)用socket()建立一個套接字,
? ?? ?? ?然后調(diào)用bind()將該套接字和本地網(wǎng)絡(luò)地址聯(lián)系在一起,
? ?? ?? ?再調(diào)用listen()使套接字做好偵聽的準(zhǔn)備,并規(guī)定它的請求隊列的長度,
? ?? ?? ?之后就調(diào)用accept()來接收連接。
? ?? ?? ?客戶在建立套接字
? ?? ?? ?然后就可調(diào)用connect()和服務(wù)器建立連接。

? ?? ?? ?客戶機和服務(wù)器之間就可以通過調(diào)用read()和write()來發(fā)送和接收數(shù)據(jù)。
? ?? ?? ?最后,待數(shù)據(jù)傳送結(jié)束后,雙方調(diào)用close()關(guān)閉套接字。
對流式套接字你所需要做的只是調(diào)用send() 函數(shù)來發(fā)送數(shù)據(jù)。而對于數(shù)據(jù)報套接字,你需要自己加個信息頭,然后調(diào)用sendto() 函數(shù)把數(shù)據(jù)發(fā)送出去
??原始套接字
? ???原始套接字主要用于一些協(xié)議的開發(fā),可以進(jìn)行比較底層的操作。它功能強大,但是沒有上面介紹的兩種套接字使用方便,一般的程序也涉及不到原始套接字
套接字結(jié)構(gòu)
struct sockaddr
這個結(jié)構(gòu)用來存儲套接字地址。
數(shù)據(jù)定義:
struct sockaddr
{
? ? unsigned short sa_family;??/* address族, AF_xxx */
? ? char sa_data[14];? ?? ?? ?? ???/* 14 bytes的協(xié)議地址 */
};
sa_family??一般來說,都是 “AF_INET”。
sa_data? ? 包含了一些遠(yuǎn)程電腦的地址、端口和套接字的數(shù)目,它里面的數(shù)據(jù)是雜溶在一切的。
為了處理struct sockaddr, 程序員建立了另外一個相似的結(jié)構(gòu)struct sockaddr_in (“in” 代表 “Internet”):
struct sockaddr_in
{
? ?short? ???int? ?? ? sin_family;? ?? ?? ???/* Internet地址族 */
? ?unsigned??short int sin_port;? ?? ? /* 端口號 */
? ?struct? ? in_addr? ?sin_addr;? ?? ?? ?/* Internet地址 */
? ?unsigned??char? ?? ?sin_zero[8];? ?/* 添0(和struct sockaddr一樣大小)*/
};
注意:
? ? 1)這個結(jié)構(gòu)提供了方便的手段來訪問socket address(struct sockaddr)結(jié)構(gòu)中的每一個元素。
? ? 2)sin_zero[8] 是為了是兩個結(jié)構(gòu)在內(nèi)存中具有相同的尺寸
? ?? ?? ?? ?? ?? ?要把sin_zero 全部設(shè)成零值(使用bzero()或memset()函數(shù))。
? ? 3)一個指向struct sockaddr_in 的指針可以聲明指向一個sturct sockaddr 的結(jié)構(gòu)。所以雖然socket() 函數(shù)需要一個structaddr * ,你也可以給他一個sockaddr_in * 。
? ? 4)在struct??sockaddr_in 中,sin_family 相當(dāng)于 在struct sockaddr 中的sa_family,需要設(shè)成 “AF_INET”。
? ? 5)一定要保證sin_port 和sin_addr 必須是網(wǎng)絡(luò)字節(jié)順序(見下節(jié))!
2.struct in_addr??( 因特網(wǎng)地址 (a structure for historical reasons) )
? ?struct in_addr
? ?{
? ?? ? unsigned long s_addr;
? ?};
? ?如果你聲明了一個 "ina" 作為一個struct sockaddr_in 的結(jié)構(gòu), 那么“ina.sin_addr.s_addr”就是4 個字節(jié)的IP 地址(按網(wǎng)絡(luò)字節(jié)順序排放)。
? ?需要注意的是,即使你的系統(tǒng)仍然使用聯(lián)合而不是結(jié)構(gòu)來表示struct in_addr,你仍然可以用上面的方法得到4 個字節(jié)的IP 地址(一些 #defines 幫了你的忙)
網(wǎng)絡(luò)字節(jié)順序
? ?因為每一個機器內(nèi)部對變量的字節(jié)存儲順序不同(有的系統(tǒng)是高位在前,底位在后,而有的系統(tǒng)是底位在前,高位在后),而網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)大家是一定要統(tǒng)一順序的。
? ?所以對與內(nèi)部字節(jié)表示順序和網(wǎng)絡(luò)字節(jié)順序不同的機器,就一定要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換(比如IP 地址的表示,端口號的表示)。
? ?但是內(nèi)部字節(jié)順序和網(wǎng)絡(luò)字節(jié)順序相同的機器該怎么辦呢?是這樣的:它們也要調(diào)用轉(zhuǎn)換函數(shù),但是真正轉(zhuǎn)換還是不轉(zhuǎn)換是由系統(tǒng)函數(shù)自己來決定的。
? ?有關(guān)的轉(zhuǎn)化函數(shù)
? ?? ?我們通常使用的有兩種數(shù)據(jù)類型:短型(兩個字節(jié))和長型(四個字節(jié))。
? ?? ?下面介紹的這些轉(zhuǎn)換函數(shù)對于這兩類的無符號整型變量都可以進(jìn)行正確的轉(zhuǎn)換。
? ?? ?如果你想將一個短型數(shù)據(jù)從主機字節(jié)順序轉(zhuǎn)換到網(wǎng)絡(luò)字節(jié)順序的話,有這樣一個函數(shù)htons:
? ?? ?? ?它是以“h”開頭的(代表“主機”);
? ?? ?? ?緊跟著它的是“to”,代表“轉(zhuǎn)換到”;
? ?? ?? ?然后是“n”代表“網(wǎng)絡(luò)”;
? ?? ?? ?最后是“s”,代表“短型數(shù)據(jù)”。
? ?? ?? ?H-to-n-s,就是htons() 函數(shù)(可以使用Hostto Network Short 來助記)
? ?? ?你可以使用 “n”,“h”,“to”,“s”,“l(fā)”的任意組合.當(dāng)然,你要在可能的情況下進(jìn)行組合。比如,系統(tǒng)是沒有stolh() 函數(shù)的(Short to Long Host?)。
? ?? ???下面給出套接字字節(jié)轉(zhuǎn)換程序的列表:
? ?? ?? ? htons()——“Host to Network Short” 主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(對無符號短型進(jìn)行操作4 bytes)
? ?? ?? ? htonl()——“Host to Network Long” 主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(對無符號長型進(jìn)行操作8 bytes)
? ?? ?? ? ntohs()——“Network to Host Short “ 網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(對無符號短型進(jìn)行操作4 bytes)
? ?? ?? ? ntohl()——“Network to Host Long “ 網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(對無符號長型進(jìn)行操作8 bytes)
? ???在struct sockaddr_in 中的sin_addr 和sin_port 他們的字節(jié)順序都是網(wǎng)絡(luò)字節(jié)順序,而sin_family 卻不是網(wǎng)絡(luò)字節(jié)順序的。為什么呢?
? ?? ???這個是因為sin_addr 和sin_port 是從IP 和UDP 協(xié)議層取出來的數(shù)據(jù),而在IP 和UDP協(xié)議層,是直接和網(wǎng)絡(luò)相關(guān)的,所以,它們必須使用網(wǎng)絡(luò)字節(jié)順序。
? ?? ???然而, sin_family 域只是內(nèi)核用來判斷struct sockaddr_in 是存儲的什么類型的數(shù)據(jù),并且, sin_family 永遠(yuǎn)也不會被發(fā)送到網(wǎng)絡(luò)上,所以可以使用主機字節(jié)順序來存儲
socket() 函數(shù)
? ?
? ?/**
? ?*
? ?* 取得套接字描述符!(記得我們以前說過的嗎?它其實就是一個文件描述符)
? ?*
? ?* domain? ?需要被設(shè)置為 “AF_INET”,就像上面的struct sockaddr_in。
? ?* type? ???參數(shù)告訴內(nèi)核這個socket 是什么類型,“SOCK_STREAM”或是“SOCK_DGRAM”。
? ?* protocol 通常為0
? ?*
? ?* return? ?如果發(fā)生錯誤,socket()函數(shù)返回 –1 。全局變量errno 將被設(shè)置為錯誤代碼。
? ?*
? ?*/
? ?#include
? ?#include
? ?int socket(int domain , int type , int protocol)
? ?示例:
? ?if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
? ?{
? ?? ???perror("create sock");
? ?? ???return -1;
? ?}
? ?else
? ?{
? ?? ?// printf("socket created...\n");
? ?}
bind() 函數(shù)
/**
*
* 為套接字綁定一個端口號
*
* 當(dāng)你需要進(jìn)行端口監(jiān)聽listen()操作,等待接受一個連入請求的時候,
* 一般都需要經(jīng)過這一步。比如網(wǎng)絡(luò)泥巴(MUD),Telnet a.b.c.d 4000
*
* 如果你只是想進(jìn)行連接一臺服務(wù)器,也就是進(jìn)行connect() 操作的時候,這一步并不是必須的。
*
*
* sockfd? ? 是由socket()函數(shù)返回的套接字描述符
* my_addr? ?是一個指向struct sockaddr 的指針,包含有關(guān)你的地址的信息:名稱、端口和IP 地址。
* addrlen? ?可以設(shè)置為sizeof(struct sockaddr)
*
* return? ? 調(diào)用錯誤的時候,返回 -1 作為錯誤發(fā)生的標(biāo)志。errno 的值為錯誤代碼。
*
*/
#include
#include
int bind (int sockfd , struct sockaddr *my_addr , int addrlen) ;
示例:
#include
#include
#include
#define??MYPORT 4000
main()
{
??int sockfd ;
??struct sockaddr_in my_addr ;
??sockfd? ?? ?? ?? ?? ?? ?= socket(AF_INET, SOCK_STREAM, 0); /* 在你自己的程序中要進(jìn)行錯誤檢查!! */
??my_addr.sin_family? ?? ?= AF_INET ;? ?? ???/* 主機字節(jié)順序 */
??my_addr.sin_port? ?? ???= htons(MYPORT);? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
??my_addr.sin_addr.s_addr = inet_addr("166.111.69.52") ;
??bzero(&(my_addr.sin_zero), 8);? ?? ?? ?? ? /* 將整個結(jié)構(gòu)剩余部分?jǐn)?shù)據(jù)設(shè)為0 */
??bind (sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));??/* 不要忘記在你自己的程序中加入判斷bind 錯誤的代碼!! */
??注意:
? ? my_addr.sin_port? ?? ?? ?是網(wǎng)絡(luò)字節(jié)順序, 短整型
? ? my_addr.sin_addr.s_addr??也是網(wǎng)絡(luò)字節(jié)順序。
??最后,bind()可以在程序中自動獲取你自己的IP 地址和端口。
? ? my_addr.sin_port = 0 ;? ?? ?? ?? ?? ???/* 隨機選擇一個端口 */
? ? my_addr.sin_addr.s_addr = INADDR_ANY ; /* 使用自己的地址 */
? ? 如上,通過設(shè)置my_addr.sin_port 為0,bind()可以知道你要它幫你選擇合適的端口;
? ? 通過設(shè)置my_addr.sin_addr.s_addr 為INADDR_ANY,bind()知道你要它將s_addr 填充為運行這個進(jìn)程的機器的IP。
? ? 這一切都可以要求bind()來自動的幫助你完成。
? ? 如果你注意到了一些細(xì)節(jié)的話,你可能會發(fā)現(xiàn)我并沒有將INADDR_ANY 轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序!是這樣的,INADDR_ANY的值為0,0 就是0,無論用什么順序排列位的順序,它都是不變的。
? ? 有讀者會想了,因為我用的INADDR_ANY 是一個#define,那么如果將我的程序移植到另外一個系統(tǒng),假如那里的INADDR_ANY是這樣定義的:
? ?? ? #define INADDR_ANY 100,
? ?? ? 那么我的程序不是就會不運行了嗎?那么下面這段代碼就OK 了:
? ?? ? my_addr.sin_port = htons(0);? ?? ?? ?? ?? ?? ? /* 隨機選擇一個未用的端口 */
? ?? ? my_addr.sin_addr.s_addr = htonl(INADDR_ANY) ;??/* 使用自己的IP地址 */
? ? 現(xiàn)在我們已經(jīng)是這么的嚴(yán)謹(jǐn),對于任何數(shù)值的INADDR_ANY調(diào)用bind 的時候就都不會有麻煩了。
? ?另外一件必須指出的事情是:
? ?? ? 當(dāng)你調(diào)用bind()的時候,不要把端口數(shù)設(shè)置的過小!小于1024 的所有端口都是保留下來作為系統(tǒng)使用端口的,沒有root 權(quán)利無法使用。你可以使用1024 以上的任何端口,一直到65535 :你所可能使用的最大的端口號(當(dāng)然,你還要保證你所希望使用的端口沒有被其他程序所使用)。
? ?最后注意有關(guān)bind()的是:
? ?? ? 有時候你并不一定要調(diào)用bind()來建立網(wǎng)絡(luò)連接。比如你只是想連接到一個遠(yuǎn)程主機上面進(jìn)行通訊,你并不在乎你究竟是用的自己機器上的哪個端口進(jìn)行通訊(比如Telnet),那么你可以簡單的直接調(diào)用connect()函數(shù),connect()將自動尋找出本地機器上的一個未使用的端口,然后調(diào)用 bind()來將其socket 綁定到那個端口上。
connect() 函數(shù)
/*
*
* sockfd? ???套接字文件描述符,由socket()函數(shù)返回的
* serv_addr??是一個存儲遠(yuǎn)程計算機的IP 地址和端口信息的結(jié)構(gòu)
* addrlen? ? 應(yīng)該是sizeof(struct sockaddr)
*
* return? ???如果發(fā)生了錯誤(比如無法連接到遠(yuǎn)程主機,或是遠(yuǎn)程主機的指定端口無法進(jìn)行連接等)它將會返回錯誤值 -1
*? ?? ?? ?? ?全局變量errno將會存儲錯誤代碼
*
*
*/
#include
#include
int connect (int sockfd, struct sockaddr *serv_addr, int addrlen);
示例:
#include
#include
#include
#define DEST_IP “166.111.69.52”
#define DEST_PORT 23
main()
{
? ?int sockfd ;
? ?/* 將用來存儲遠(yuǎn)程信息 */
? ?struct sockaddr_in dest_addr ;
? ?/* 注意在你自己的程序中進(jìn)行錯誤檢查!! */
? ?sockfd = socket(AF_INET, SOCK_STREAM, 0);
? ?/* 主機字節(jié)順序 */
? ?dest_addr.sin_family = AF_INET ;
? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
? ?dest_addr.sin_port = htons(DEST_PORT(;
? ?dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);
? ?/* 將剩下的結(jié)構(gòu)中的空間置0 */
? ?bzero(&(dest_addr.sin_zero), 8);
? ?/* 不要忘記在你的代碼中對connect()進(jìn)行錯誤檢查!! */
? ?connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));
? ?注意我們沒有調(diào)用bind()函數(shù)。基本上,我們并不在乎我們本地用什么端口來通訊,是不是?我們在乎的是我們連到哪臺主機上的哪個端口上。Linux 內(nèi)核自動為我們選擇了一個沒有被使用的本地端口。

listen() 函數(shù)

/*
*
* 等待別人連接,進(jìn)行系統(tǒng)偵聽請求
* 當(dāng)有人連接你的時候,你有兩步需要做:
*? ???通過listen()函數(shù)等待連接請求
*? ???然后使用accept()函數(shù)來處理
*
* 那么我們需要指定本地端口了,因為我們是等待別人的連接。所以,在listen()函數(shù)調(diào)用之前,我們需要使用bind() 函數(shù)來指定使用本地的哪一個端口數(shù)值
* 如果你想在一個端口上接受外來的連接請求的話,那么函數(shù)的調(diào)用順序為:
*??socket();
*??bind();
*??listen();
*
* sockfd? ? 是一個套接字描述符,由socket()系統(tǒng)調(diào)用獲得
* backlog? ?是未經(jīng)過處理的連接請求隊列可以容納的最大數(shù)目(每一個連入請求都要進(jìn)入一個連入請求隊列,等待listen 的程序調(diào)用accept()函數(shù)來接受這個連接。當(dāng)系統(tǒng)還沒有調(diào)用accept()函數(shù)的時候,如果有很多連接,那么本地能夠等待的最大數(shù)目就是 backlog 的數(shù)值。你可以將其設(shè)成5 到10 之間的數(shù)值(推薦))
*
*
* return? ? 錯誤返回-1, 并設(shè)置全局錯誤代碼變量errno
*/
#include
int listen(int sockfd, int backlog);
accept()函數(shù)
/*
* 當(dāng)調(diào)用它的時候,大致過程是下面這樣的:
*? ???有人從很遠(yuǎn)很遠(yuǎn)的地方嘗試調(diào)用connect()來連接你的機器上的某個端口(當(dāng)然是你已經(jīng)在listen()的)
*? ???他的連接將被listen 加入等待隊列等待accept()函數(shù)的調(diào)用
*? ???你調(diào)用accept()函數(shù),告訴他你準(zhǔn)備連接
*
* sockfd? ?是正在listen() 的一個套接字描述符
* addr? ???一般是一個指向struct sockaddr_in 結(jié)構(gòu)的指針;里面存儲著遠(yuǎn)程連接過來的計算機的信息(比如遠(yuǎn)程計算機的IP 地址和端口)
* addrlen??是一個本地的整型數(shù)值,在它的地址傳給accept() 前它的值應(yīng)該是sizeof(struct sockaddr_in);accept()不會在addr 中存儲多余addrlen bytes 大小的數(shù)據(jù)。如果accept()函數(shù)在addr 中存儲的數(shù)據(jù)量不足addrlen,則accept()函數(shù)會改變addrlen 的值來反應(yīng)這個情況。
*
*
* return? ?accept()函數(shù)將回返回一個新的套接字描述符,這個描述符就代表了這個連接
*? ?? ?? ? 這時候你有了兩個套接字描述符:
*? ?? ?? ?? ? 返回給你的那個就是和遠(yuǎn)程計算機的連接, 這時候你所得到的那個新的套接字描述符就可以進(jìn)行send()操作和recv()操作了。
*? ?? ?? ?? ? 而第一個套接字描述符仍然在你的機器上原來的那個端口上listen()
*
*? ?? ?? ? -1 來表明調(diào)用失敗,同時全局變量errno 將會存儲錯誤代碼
*/
#include
int accept(int sockfd, void *addr, int *addrlen);
示例:
#include
#include
#include
/* 用戶連接的端口號 */
#define MYPORT 4000
/* 等待隊列中可以存儲多少個未經(jīng)過accept()處理的連接 */
#define BACKLOG 10
main()
{
? ?/* 用來監(jiān)聽網(wǎng)絡(luò)連接的套接字sock_fd,用戶連入的套接字使用new_fd */
? ?int sockfd, new_fd ;
? ?/* 本地的地址信息 */
? ?struct sockaddr_in my_addr ;
? ?/* 連接者的地址信息 */
? ?struct sockaddr_in their_addr ;
? ?int sin_size;
? ?/* 記得在自己的程序中這部分要進(jìn)行錯誤檢查! */
? ?sockfd = socket(AF_INET, SOCK_STREAM, 0) ;
? ?/* 主機字節(jié)順序 */
? ?my_addr.sin_family = AF_INET ;
? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
? ?my_addr.sin_port = htons(MYPORT) ;
? ?/* 自動賦值為自己的IP */
? ?my_addr.sin_addr.s_addr = INADDR_ANY ;
? ?/* 將結(jié)構(gòu)中未使用部分全部清零 */
? ?bzero(&(my_addr.sin_zero), 8) ;
? ?/* 不要忘記在你自己的程序中下面的程序調(diào)用需要進(jìn)行錯誤檢測!!*/
? ?bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

? ?listen(sockfd, BACKLOG);
? ?sin_size = sizeof(struct sockaddr_in);
? ?new_fd = accept(sockfd, &their_addr, &sin_size);
send()、recv()函數(shù)
/*
*
*??這兩個函數(shù)是最基本的,通過連接的套接字流進(jìn)行通訊的函數(shù)
*??如果你想使用無連接的使用者數(shù)據(jù)報的話,請參sendto() 和recvfrom() 函數(shù)。
*
*??sockfd 是代表你與遠(yuǎn)程程序連接的套接字描述符。
*??msg? ? 是一個指針,指向你想發(fā)送的信息的地址。
*??len? ? 是你想發(fā)送信息的長度
*??flags??發(fā)送標(biāo)記。一般都設(shè)為0(你可以查看send 的man pages 來獲得其他的參數(shù)值并且明白各個參數(shù)所代表的含義)
*??
*??return??函數(shù)在調(diào)用后會返回它真正發(fā)送數(shù)據(jù)的長度
*? ?? ?? ? -1??如果發(fā)生錯誤,錯誤代碼存儲在全局變量errno
*
*/
#include
#include
int send(int sockfd, const void *msg, int len, int flags);
示例:
char *msg = "Hello! World! ";
int len, bytes_sent;
len = strlen(msg);
bytes_sent = send(sockfd, msg, len, 0);
注意:
? ?send() 所發(fā)送的數(shù)據(jù)可能少于你給它的參數(shù)所指定的長度!
? ?因為如果你給send()的參數(shù)中包含的數(shù)據(jù)的長度遠(yuǎn)遠(yuǎn)大于send()所能一次發(fā)送的數(shù)據(jù),則send()函數(shù)只發(fā)送它所能發(fā)送的最大數(shù)據(jù)長度,然后它相信你會把剩下的數(shù)據(jù)再次調(diào)用它來進(jìn)行第二次發(fā)送。
? ?所以,記住如果send()函數(shù)的返回值小于len 的話,則你需要再次發(fā)送剩下的數(shù)據(jù)。
? ?幸運的是,如果包足夠小(小于1K),那么send()一般都會一次發(fā)送光的。
recv()函數(shù)
/*
*
*??sockfd??是你要讀取數(shù)據(jù)的套接字描述符
*??buf? ???是一個指針,指向你能存儲數(shù)據(jù)的內(nèi)存緩存區(qū)域
*??len? ???是緩存區(qū)的最大尺寸
*??flags? ?是recv() 函數(shù)的一個標(biāo)志,一般都為0 (具體的其他數(shù)值和含義請參考recv()的man pages)
*
*
*??返回? ? 它所真正收到的數(shù)據(jù)的長度(也就是存到buf 中數(shù)據(jù)的長度)
*
*? ?? ?? ? -1? ? 則代表發(fā)生了錯誤(比如網(wǎng)絡(luò)以外中斷、對方關(guān)閉了套接字連接等),全局變量errno 里面存儲了錯誤代碼
*/
#include
#include
int recv(int sockfd, void *buf, int len, unsigned int flags);
sendto() 和recvfrom() 函數(shù)
/*
* 這兩個函數(shù)是進(jìn)行無連接的UDP 通訊時使用的。
* 使用這兩個函數(shù),則數(shù)據(jù)會在沒有建立過任何連接的網(wǎng)絡(luò)上傳輸。因為數(shù)據(jù)報套接字無法對遠(yuǎn)程主機進(jìn)行連接
*
* sockfd??是代表你與遠(yuǎn)程程序連接的套接字描述符
* msg? ???是一個指針,指向你想發(fā)送的信息的地址
* len? ???是你想發(fā)送信息的長度
* flags? ?發(fā)送標(biāo)記。一般都設(shè)為0 (你可以查看send 的man pages 來獲得其他的參數(shù)值并且明白各個參數(shù)所代表的含義)
* to? ?? ?是一個指向struct sockaddr 結(jié)構(gòu)的指針,里面包含了遠(yuǎn)程主機的IP 地址和端口數(shù)據(jù)
* tolen? ?只是指出了struct sockaddr 在內(nèi)存中的大小sizeof(struct sockaddr)
*
* return??sendto()返回它所真正發(fā)送的字節(jié)數(shù)(當(dāng)然也和send()一樣,它所真正發(fā)送的字節(jié)數(shù)可能小于你所給它的數(shù)據(jù)的字節(jié)數(shù))
*? ?? ?? ?-1 表示出錯? ?同時全局變量errno 存儲了錯誤代碼
*/
#include
#include
int sendto(int sockfd, const void *msg, int len, unsigned int flags, const struct sockaddr *to, int tolen);
recvfrom()函數(shù)
/*
*
* sockfd??是你要讀取數(shù)據(jù)的套接字描述符
* buf? ???是一個指針,指向你能存儲數(shù)據(jù)的內(nèi)存緩存區(qū)域
* len? ???是緩存區(qū)的最大尺寸
* flags? ?是recv() 函數(shù)的一個標(biāo)志,一般都為0 (具體的其他數(shù)值和含義請參考recv()的man pages)
* from? ? 是一個本地指針,指向一個struct sockaddr 的結(jié)構(gòu)(里面存有源IP 地址和端口數(shù))
* fromlen 是一個指向一個int 型數(shù)據(jù)的指針,它的大小應(yīng)該是sizeof (struct sockaddr).當(dāng)函數(shù)返回的時候,formlen 指向的數(shù)據(jù)是form 指向的struct sockaddr 的實際大小.
*? ?? ?? ?如果一個信息大得緩沖區(qū)都放不下,那么附加信息將被砍掉。該調(diào)用可以立即返回,也可以永久的等待。這取決于你把flags 設(shè)置成什么類型。你甚至可以設(shè)置超時(timeout)值。
*
*
* return??返回它接收到的字節(jié)數(shù),如果發(fā)生了錯誤,它就返回–1 ,全局變量errno存儲了錯誤代碼
*
*/
#include
#include
int recvfrom(int sockfd, void *buf, int len, unsigned int flags, struct sockaddr *from, int *fromlen);
注意:
? ?如果你使用cnnect()連接到了一個數(shù)據(jù)報套接字的服務(wù)器程序上,那么你就可以使用send() 和recv() 函數(shù)來傳輸你的數(shù)據(jù).
? ?不要以為你在使用一個流式的套接字,你所使用的仍然是一個使用者數(shù)據(jù)報的套接字,只不過套接字界面在send() 和recv()的時候自動幫助你加上了目標(biāo)地址,目標(biāo)端口的信息.
close()和shutdown()函數(shù)
/*
* 程序進(jìn)行網(wǎng)絡(luò)傳輸完畢后,你需要關(guān)閉這個套接字描述符所表示的連接。實現(xiàn)這個非常簡單,只需要使用標(biāo)準(zhǔn)的關(guān)閉文件的函數(shù):close()。
* 執(zhí)行close()之后,套接字將不會在允許進(jìn)行讀操作和寫操作。任何有關(guān)對套接字描述符進(jìn)行讀和寫的操作都會接收到一個錯誤。
*
*/
close(sockfd);
/*
* 如果你想對網(wǎng)絡(luò)套接字的關(guān)閉進(jìn)行進(jìn)一步的操作的話,你可以使用函數(shù)shutdown()
* 它允許你進(jìn)行單向的關(guān)閉操作,或是全部禁止掉。
*
* 如果你在一個未連接的數(shù)據(jù)報套接字上使用shutdown() 函數(shù),它將什么也不做.
*
* sockfd 是一個你所想關(guān)閉的套接字描述符
* how 可以取下面的值。
*? ???0 表示不允許以后數(shù)據(jù)的接收操;
*? ???1 表示不允許以后數(shù)據(jù)的發(fā)送操作;
*? ???2 表示和close()一樣,不允許以后的任何操作(包括接收,發(fā)送數(shù)據(jù))
*
* return??0 執(zhí)行成功
*? ?? ???-1 執(zhí)行失敗, 全局變量errno 中存儲了錯誤代碼.
*? ?
*/
#include
int shutdown(int sockfd, int how);
setsockopt() 和getsockopt() 函數(shù)
Linux 所提供的socket 庫含有一個錯誤(bug)。
??此錯誤表現(xiàn)為你不能為一個套接字重新啟用同一個端口號,即使在你正常關(guān)閉該套接字以后。
??例如,比方說,你編寫一個服務(wù)器在一個套接字上等待的程序.服務(wù)器打開套接字并在其上偵聽是沒有問題的。無論如何,總有一些原因(不管是正常還是非正常的結(jié)束程序)使你的程序需要重新啟動。然而重啟動后你就不能把它綁定在原來那個端口上了。從bind()系統(tǒng)調(diào)用返回的錯誤代碼總是報告說你試圖連接的端口已經(jīng)被別的進(jìn)程所綁定。
??問題就是Linux 內(nèi)核在一個綁定套接字的進(jìn)程結(jié)束后從不把端口標(biāo)記為未用。在大多數(shù)Linux/UNIX 系統(tǒng)中,端口可以被一個進(jìn)程重復(fù)使用,甚至可以被其它進(jìn)程使用。
??在Linux 中繞開這個問題的辦法是,當(dāng)套接字已經(jīng)打開但尚未有連接的時候用setsockopt()系統(tǒng)調(diào)用在其上設(shè)定選項(options)。
??setsockopt() 調(diào)用設(shè)置選項而getsockopt()從給定的套接字取得選項。
這里是這些調(diào)用的語法:
/*
*
*
* sockfd 必須是一個已打開的套接字
* level 是函數(shù)所使用的協(xié)議標(biāo)準(zhǔn)(protocol level)(TCP/IP 協(xié)議使用IPPROTO_TCP,套接字標(biāo)準(zhǔn)的選項實用SOL_SOCKET)
* name 選項在套接字說明書中(man page)有詳細(xì)說明
* value 指向為getsockopt()函數(shù)所獲取的值,setsockopt()函數(shù)所設(shè)置的值的地址
* optlen 指針指向一個整數(shù),該整數(shù)包含參數(shù)以字節(jié)計算的長度
*
*
*
*
*
*/
#include
#include
int getsockopt(int sockfd, int level, int name, char *value, int *optlen);
int setsockopt(int sockfd, int level, int name, char *value, int *optlen);
當(dāng)你打開一個套接字時必須同時用下面的代碼段來調(diào)用setsockopt()函數(shù):
/* 設(shè)定參數(shù)數(shù)值 */
opt = 1;
len = sizeof(opt);
/* 設(shè)置套接字屬性 */
setsockopt(sockfd,SOL_SOCKET,SO_REUSEADDR,&opt,&len);
getpeername()函數(shù)
/*
* 這個函數(shù)可以取得一個已經(jīng)連接上的套接字的遠(yuǎn)程信息(比如IP 地址和端口),告訴你在遠(yuǎn)程和你連接的究竟是誰
*
* 當(dāng)你擁有了遠(yuǎn)程連接用戶的IP 地址,你就可以使用inet_ntoa() 或gethostbyaddr()來輸出信息或是做進(jìn)一步的處理
*
* sockfd??是你想取得遠(yuǎn)程信息的那個套接字描述符
* addr? ? 是一個指向struct sockaddr (或是struct sockaddr_in)的指針
* addrlen 是一個指向int 的指針,應(yīng)該賦于sizeof(struct sockaddr)的大小
*
*
* return??錯誤,函數(shù)將返回 –1 ,并且錯誤代碼儲存在全局變量errno 中
*
*/
#include
int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);
gethostname()函數(shù)
/*
* 可以取得本地主機的信息,它返回正在執(zhí)行它的計算機的名字
* 返回的這個名字可以被gethostbyname()函數(shù)使用,由此可以得到本地主機的IP 地址
*
* hostname??是一個指向字符數(shù)組的指針,當(dāng)函數(shù)返回的時候,它里面的數(shù)據(jù)就是本地的主機的名字
* size? ?? ?是hostname 指向的數(shù)組的長度
*
*
* return? ? 成功執(zhí)行,它返回0
*? ?? ?? ???錯誤,則返回–1,全局變量errno 中存儲著錯誤代碼
*
*/
#include
int gethostname(char *hostname, size_t size);
gethostbyname()函數(shù)
/*
*
* 網(wǎng)絡(luò)地址是以網(wǎng)絡(luò)字節(jié)順序存儲的
*
*
* return? ? 成功則返回指向結(jié)構(gòu)struct hostent的指針
*
? ?? ?? ?? ?#define h_addr h_addr_list[0]? ? //h_addr 是 h_addr_list 數(shù)組的第一個成員
? ?? ?? ?? ?struct hostent
? ?? ?? ?? ?{
? ?? ?? ?? ?? ?char *h_name;? ?? ? //是這個主機的正式名稱
? ?? ?? ?? ?? ?char **h_aliases;? ?//是一個以NULL(空字符)結(jié)尾的數(shù)組,里面存儲了主機的備用名稱
? ?? ?? ?? ?? ?int??h_addrtype;? ? //是返回地址的類型,一般來說是“AF_INET”
? ?? ?? ?? ?? ?int??h_length;? ?? ?//是地址的字節(jié)長度
? ?? ?? ?? ?? ?char **h_addr_list; //是一個以0 結(jié)尾的數(shù)組,存儲了主機的網(wǎng)絡(luò)地址
? ?? ?? ?? ?};
*
*
*? ?? ?? ???如果發(fā)生錯誤,它將會返回NULL(但是errno 并不代表錯誤代碼,h_errno 中存儲的才識錯誤代碼。參考下面的herror()函數(shù)
*/
struct hostent *gethostbyname(const char *name);
五種I/O 模式
----------------------------------------
在Linux/UNIX 下,有下面這五種I/O 操作方式:
? ?阻塞I/O
? ?非阻塞I/O
? ?I/O 多路復(fù)用
? ?信號驅(qū)動I/O(SIGIO)
? ?異步I/O
程序進(jìn)行輸入操作有兩步:
? ?等待有數(shù)據(jù)可以讀
? ?將數(shù)據(jù)從系統(tǒng)內(nèi)核中拷貝到程序的數(shù)據(jù)區(qū)。
對于一個對套接字的輸入操作:
? ???第一步一般來說是,等待數(shù)據(jù)從網(wǎng)絡(luò)上傳到本地,當(dāng)數(shù)據(jù)包到達(dá)的時候,數(shù)據(jù)將會從網(wǎng)絡(luò)層拷貝到內(nèi)核的緩存中;
? ???第二步是從內(nèi)核中把數(shù)據(jù)拷貝到程序的數(shù)據(jù)區(qū)中
.阻塞I/O 模式
? ???簡單的說,阻塞就是"睡眠"的同義詞
? ?? ?? ?如你運行上面的listener 的時候,它只不過是簡單的在那里等待接收數(shù)據(jù)。它調(diào)用recvfrom()函數(shù),但是那個時候(listener 調(diào)用recvfrom()函數(shù)的時候),它并沒有數(shù)據(jù)可以接收.所以recvfrom()函數(shù)阻塞在那里(也就是程序停在recvfrom()函數(shù)處睡大覺)直到有數(shù)據(jù)傳過來阻塞.你應(yīng)該明白它的意思。
? ???阻塞I/O 模式是最普遍使用的I/O 模式。大部分程序使用的都是阻塞模式的I/O 。
? ???缺省的,一個套接字建立后所處于的模式就是阻塞I/O 模式。
? ???對于一個UDP 套接字來說,數(shù)據(jù)就緒的標(biāo)志比較簡單:
? ?? ?? ?已經(jīng)收到了一整個數(shù)據(jù)報
? ?? ?? ?沒有收到。
? ???而TCP 這個概念就比較復(fù)雜,需要附加一些其他的變量
? ?? ?? ?一個進(jìn)程調(diào)用recvfrom ,然后系統(tǒng)調(diào)用并不返回知道有數(shù)據(jù)報到達(dá)本地系統(tǒng),然后系統(tǒng)將數(shù)據(jù)拷貝到進(jìn)程的緩存中。
? ?? ???(如果系統(tǒng)調(diào)用收到一個中斷信號,則它的調(diào)用會被中斷)我們稱這個進(jìn)程在調(diào)用recvfrom 一直到從recvfrom 返回這段時間是阻塞的。
? ?? ?? ?當(dāng)recvfrom正常返回時,我們的進(jìn)程繼續(xù)它的操作。
.非阻塞模式I/O
? ? 當(dāng)我們將一個套接字設(shè)置為非阻塞模式,我們相當(dāng)于告訴了系統(tǒng)內(nèi)核:“當(dāng)我請求的I/O 操作不能夠馬上完成,你想讓我的進(jìn)程進(jìn)行休眠等待的時候,不要這么做,請馬上返回一個錯誤給我。”
? ?
? ? 如我們開始對recvfrom 的三次調(diào)用,因為系統(tǒng)還沒有接收到網(wǎng)絡(luò)數(shù)據(jù),所以內(nèi)核馬上返回一個EWOULDBLOCK的錯誤。
? ? 第四次我們調(diào)用recvfrom 函數(shù),一個數(shù)據(jù)報已經(jīng)到達(dá)了,內(nèi)核將它拷貝到我們的應(yīng)用程序的緩沖區(qū)中,然后recvfrom 正常返回,我們就可以對接收到的數(shù)據(jù)進(jìn)行處理了。
??
? ? 當(dāng)一個應(yīng)用程序使用了非阻塞模式的套接字,它需要使用一個循環(huán)來不聽的測試是否一個文件描述符有數(shù)據(jù)可讀(稱做polling)。
? ? 應(yīng)用程序不停的polling 內(nèi)核來檢查是否I/O操作已經(jīng)就緒。這將是一個極浪費CPU 資源的操作。這種模式使用中不是很普遍
.I/O 多路復(fù)用 select()
? ? 在使用I/O 多路技術(shù)的時候,我們調(diào)用select()函數(shù)和poll()函數(shù),在調(diào)用它們的時候阻塞,而不是我們來調(diào)用recvfrom(或recv)的時候阻塞。
? ? 當(dāng)我們調(diào)用select 函數(shù)阻塞的時候,select 函數(shù)等待數(shù)據(jù)報套接字進(jìn)入讀就緒狀態(tài)。當(dāng)select 函數(shù)返回的時候,也就是套接字可以讀取數(shù)據(jù)的時候。這時候我們就可以調(diào)用recvfrom函數(shù)來將數(shù)據(jù)拷貝到我們的程序緩沖區(qū)中。
? ? 和阻塞模式相比較,select()和poll()并沒有什么高級的地方,而且,在阻塞模式下只需要調(diào)用一個函數(shù):讀取或發(fā)送,在使用了多路復(fù)用技術(shù)后,我們需要調(diào)用兩個函數(shù)了:先調(diào)用select()函數(shù)或poll()函數(shù),然后才能進(jìn)行真正的讀寫。
? ?
? ? 多路復(fù)用的高級之處在于,它能同時等待多個文件描述符,而這些文件描述符(套接字描述符)其中的任意一個進(jìn)入讀就緒狀態(tài),select()函數(shù)就可以返回
? ? 假設(shè)我們運行一個網(wǎng)絡(luò)客戶端程序,要同時處理套接字傳來的網(wǎng)絡(luò)數(shù)據(jù)又要處理本地的標(biāo)準(zhǔn)輸入輸出。在我們的程序處于阻塞狀態(tài)等待標(biāo)準(zhǔn)輸入的數(shù)據(jù)的時候,假如服務(wù)器端的程序被kill(或是自己Down 掉了),那么服務(wù)器程端的TCP 協(xié)議會給客戶端(我們這端)的TCP 協(xié)議發(fā)送一個FIN 數(shù)據(jù)代表終止連接。但是我們的程序阻塞在等待標(biāo)準(zhǔn)輸入的數(shù)據(jù)上,在它讀取套接字?jǐn)?shù)據(jù)之前(也許是很長一段時間),它不會看見結(jié)束標(biāo)志.我們就不能夠使用阻塞模式的套接字。
? ? I/O多路技術(shù)一般在下面這些情況中被使用:
? ?? ? 當(dāng)一個客戶端需要同時處理多個文件描述符的輸入輸出操作的時候(一般來說是標(biāo)準(zhǔn)的輸入輸出和網(wǎng)絡(luò)套接字), I/O 多路復(fù)用技術(shù)將會有機會得到使用。
? ?? ? 當(dāng)程序需要同時進(jìn)行多個套接字的操作的時候。
? ?? ? 如果一個TCP 服務(wù)器程序同時處理正在偵聽網(wǎng)絡(luò)連接的套接字和已經(jīng)連接好的套接字。
? ?? ? 如果一個服務(wù)器程序同時使用TCP 和UDP 協(xié)議。
? ?? ? 如果一個服務(wù)器同時使用多種服務(wù)并且每種服務(wù)可能使用不同的協(xié)議(比如inetd就是這樣的)。
??
? ? I/O 多路服用技術(shù)并不只局限與網(wǎng)絡(luò)程序應(yīng)用上。幾乎所有的程序都可以找到應(yīng)用I/O多路復(fù)用的地方。
fcntl()函數(shù)
? ???簡單的說,阻塞就是"睡眠"的同義詞.
? ???如你運行上面的listener 的時候,它只不過是簡單的在那里等待接收數(shù)據(jù)。它調(diào)用recvfrom()函數(shù),但是那個時候(listener 調(diào)用recvfrom()函數(shù)的時候),它并沒有數(shù)據(jù)可以接收.所以recvfrom()函數(shù)阻塞在那里(也就是程序停在recvfrom()函數(shù)處睡大覺)直到有數(shù)據(jù)傳過來阻塞.你應(yīng)該明白它的意思。
? ???當(dāng)你一開始建立一個套接字描述符的時候,系統(tǒng)內(nèi)核就被設(shè)置為阻塞狀態(tài)。如果你不想你的套接字描述符是處于阻塞狀態(tài)的,那么你可以使用函數(shù)fcntl()。
? ???#include
? ???#include
? ???int fcntl (int fd, int cmd, long arg);
示例:
? ???sockfd = socket(AF_INET, SOCK_STREAM, 0);
? ???fcntl(sockfd, F_SETFL, O_NONBLOCK);
? ???這樣將一個套接字設(shè)置為無阻塞模式后,你可以對套接字描述符進(jìn)行有效的“檢測”.
? ???如果你嘗試從一個沒有接收到任何數(shù)據(jù)的無阻塞模式的套接字描述符那里讀取數(shù)據(jù),那么讀取函數(shù)會馬上返回–1 代表發(fā)生錯誤,全局變量errno 中的值為EWOULDBLOCK。
? ???一般來說,這種無阻塞模式在某些情況下不是一個好的選擇。假如你的程序一直沒有接收到傳過來的數(shù)據(jù),那么你的程序就會進(jìn)行不停的循環(huán)來檢查是否有數(shù)據(jù)到來,浪費了大量的CPU 時間,而這些CPU 時間本來可以做其他事情的。
? ???另外一個比較好的檢測套接字描述符的方法是調(diào)用select()函數(shù)
套接字選擇項select()函數(shù)
/*
*
*??這個技術(shù)有一點點奇怪但是它對我們的程序確是非常有用的。
*??假想一下下面的情況:
*? ?? ?你寫的服務(wù)器程序想監(jiān)聽客戶端的連接,但是你同時又想從你以前已經(jīng)建立過的連接中來讀取數(shù)據(jù)。
*??你可能會說:“沒有問題,我不就是需要使用一個accept()函數(shù)和一對兒recv()函數(shù)嗎?”。
*??不要這么著急,你要想想,當(dāng)你調(diào)用accept()函數(shù)阻塞的時候,你還能調(diào)用recv()函數(shù)嗎?
*??“使用非阻塞套接字!”你可能會這么說。是的,你可以。但是如果你又不想浪費寶貴的CPU 時間,該怎么辦呢?
*??Select()函數(shù)可以幫助你同時監(jiān)視許多套接字。它會告訴你哪一個套接字已經(jīng)可以讀取數(shù)據(jù),
*??哪個套接字已經(jīng)可以寫入數(shù)據(jù),甚至你可以知道哪個套接字出現(xiàn)了錯誤,如果你想知道的話。
*
*??
*
* 當(dāng)select()函數(shù)返回的時候,readfds 將會被修改用來告訴你哪一個文件描述符你可以用來讀取數(shù)據(jù)。
*
* numfds? ?? ?? ?是readfds,writefds,exceptfds 中fd 集合中文件描述符中最大的數(shù)字加上1 也就是sockfd+1(因為標(biāo)準(zhǔn)輸入的文件描述符的值為0 ,所以其他任何的文件描述符都會比標(biāo)準(zhǔn)輸入的文件描述符大)。
*
* readfds? ?? ???中的fd 集合將由select 來監(jiān)視是否可以讀取,如果你想知道是是否可以從標(biāo)準(zhǔn)輸入和一些套接字(sockfd)中讀取數(shù)據(jù),你就可以把文件描述符和sockfd 加入readfds 中。
* writefds? ?? ? 中的fds 集合將由select 來監(jiān)視是否可以寫入
* exceptfds? ?? ?中的fds 集合將由select 來監(jiān)視是否有例外發(fā)生
* struct timeval 超時設(shè)置。
*? ?? ?? ?? ?? ?? ???一般來說,如果沒有任何文件描述符滿足你的要求,你的程序是不想永遠(yuǎn)等下去的.也許每隔1 分鐘你就想在屏幕上輸出信息:“hello!”。
*? ?? ?? ?? ?? ? 這個代表時間的結(jié)構(gòu)將允許你定義一個超時。
*? ?? ?? ?? ?? ? 在調(diào)用select()函數(shù)中,如果時間超過timeval 參數(shù)所代表的時間長度,
*? ?? ?? ?? ?? ? 而還沒有文件描述符滿足你的要求,那么select()函數(shù)將回返回,允許你進(jìn)行下面的操作。
*? ?? ?? ?? ?? ? 只需要將tv_sec 設(shè)置為你想等待的秒數(shù),然后設(shè)置tv_usec 為想等待的微秒數(shù)
*? ?? ?? ?? ?? ? (真正的時間就是tv_sec 所表示的秒數(shù)加上tv_usec 所表示的微秒數(shù)).注意,是微秒(百萬分之一)而不是毫秒.
*? ?? ?? ?? ?? ? 一秒有1,000 毫秒,一毫秒有1,000 微秒。所以,一秒有1,000,000 微秒.
*? ?? ?? ?? ?? ? 這個timeval 結(jié)構(gòu)定義如下:
*? ?? ?? ?? ?? ? struct timeval
*? ?? ?? ?? ?? ? {
*? ?? ?? ?? ?? ?? ???int tv_sec ;? ?//秒數(shù)
*? ?? ?? ?? ?? ?? ???int tv_usec ;??//微秒
*? ?? ?? ?? ?? ? };
*? ?? ?? ?? ?? ? 我們擁有了一個以微秒為單位的記時器!但是因為Linux 和UNIX 一樣,最小的時間片是100 微秒,所以不管你將tv_usec 設(shè)置的多小,實質(zhì)上記時器的最小單位是100微秒.
*
*? ?? ?? ?? ?? ? 如果你將struct timeval 設(shè)置為0,則select()函數(shù)將會立即返回,同時返回在你的集合中的文件描述符的狀態(tài)。
*
*? ?? ?? ?? ?? ? 如果你將timeout 這個參數(shù)設(shè)置為NULL,則select()函數(shù)進(jìn)入阻塞狀態(tài),除了等待到文件描述符的狀態(tài)變化,否則select()函數(shù)不會返回。
*
*
* return? ?? ???當(dāng)select()函數(shù)返回的時候,timeval 中的時間將會被設(shè)置為執(zhí)行為select()后還剩下的時間。
*
*
*
*/
#include
#include
#include
int select(int numfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
使用FD_ISSET() 宏,你可以選出select()函數(shù)執(zhí)行的結(jié)果。
在進(jìn)行更深的操作前,我們來看一看怎樣處理這些fd_sets。下面這些宏可以是專門進(jìn)行這類操作的:
??FD_ZERO(fd_set *set)? ?? ?? ???將一個文件描述符集合清零
??FD_SET(int fd, fd_set *set)? ? 將文件描述符fd 加入集合set 中。
??FD_CLR(int fd, fd_set *set)? ? 將文件描述符fd 從集合set 中刪除.
??FD_ISSET(int fd, fd_set *set)??測試文件描述符fd 是否存在于文件描述符set 中.
下面這段代碼演示了從標(biāo)準(zhǔn)輸入等待輸入等待2.5 秒.
#include
#include
#include
/* 標(biāo)準(zhǔn)輸入的文件描述符數(shù)值 */
#define STDIN 0
main()
{
? ?fd_set readfds;
? ?struct timeval tv;
? ?/* 設(shè)置等待時間為2 秒零500,000 微秒 */
? ?tv.tv_sec??= 2;
? ?tv.tv_usec = 500000;
? ?FD_ZERO(&readfds);
? ?FD_SET(STDIN, &readfds);
? ?/* 因為我們只想等待輸入,所以將writefds 和execeptfds 設(shè)為NULL */
? ?/* 程序?qū)谶@里等待2 秒零500,000 微秒,除非在這段時間中標(biāo)準(zhǔn)輸入有操作 */
? ?select(STDIN+1, &readfds, NULL, NULL, &tv);
? ?/* 測試ST
Socket編程知識必學(xué)
/*
*
* Author: cnscn
* HOME:??
http://www.cnscn.org
* 整理自《Linux網(wǎng)絡(luò)編程》
*/

端口號常識:

? ? 端口號被從1 開始分配。
? ? 通常端口號超出255 的部分被本地主機保留為私有用途。
? ? 1到255 之間的號碼被用于遠(yuǎn)程應(yīng)用程序所請求的進(jìn)程和網(wǎng)絡(luò)服務(wù)。
? ? 每個網(wǎng)絡(luò)通信循環(huán)地進(jìn)出主計算機的TCP 應(yīng)用層。它被兩個所連接的號碼唯一地識別。這兩個號碼合起來叫做套接字.
? ?? ???組成套接字的這兩個號碼就是機器的IP 地址和TCP 軟件所使用的端口號。
套接字的三種類型
? ? 流式套接字(SOCK_STREAM),數(shù)據(jù)報套接字(SOCK_DGRAM)及原始套接字(RAW)。
??流式套接字(SOCK_STREAM)
? ? 流式的套接字可以提供可靠的、面向連接的通訊流。
? ? 如果你通過流式套接字發(fā)送了順序的數(shù)據(jù):“1”、“2”。那么數(shù)據(jù)到達(dá)遠(yuǎn)程時候的順序也是“1”、“2”。
? ? Telnet 應(yīng)用程序、BBS服務(wù)、以及系統(tǒng)的遠(yuǎn)程登陸都是通過Telnet 協(xié)議連接的。Telnet 就是一個流式連接。你是否希望你在Telnet 應(yīng)用程序上輸入的字符(或漢字)在到達(dá)遠(yuǎn)程應(yīng)用程序的時候是以你輸入的順序到達(dá)的?答案應(yīng)該是肯定的吧。
? ? 還有WWW 瀏覽器,它使用的HTTP 協(xié)議也是通過流式套接字來獲取網(wǎng)頁的。事實上,如果你Telnet 到一個Web Site 的80 端口上,然后輸入 “GET 網(wǎng)頁路徑名”然后按兩下回車(或者是兩下Ctrl+回車)然后你就得到了“網(wǎng)頁路徑名”所代表的網(wǎng)頁!
??數(shù)據(jù)報套接字(SOCK_DGRAM)
? ? 數(shù)據(jù)報套接字定義了一種無連接的服務(wù),數(shù)據(jù)通過相互獨立的報文進(jìn)行傳輸,是無序的,并且不保證可靠,無差錯。
? ?? ? 如果你發(fā)送了一個數(shù)據(jù)報,它可能不會到達(dá)。
? ?? ? 它可能會以不同的順序到達(dá)。
? ?? ? 如果它到達(dá)了,它包含的數(shù)據(jù)中可能存在錯誤。
? ?? ? 數(shù)據(jù)報套接字也使用IP,但是它不使用TCP,它使用使用者數(shù)據(jù)報協(xié)議UDP(User Datagram Protocol 可以參考RFC 768)
? ?為什么說它們是“無連接”的呢?因為它(UDP)不像流式套接字那樣維護(hù)一個打開的連接,你只需要把數(shù)據(jù)打成一個包,把遠(yuǎn)程的IP 貼上去,然后把這個包發(fā)送出去。這個過程是不需要建立連接的。
? ?? ? UDP 的應(yīng)用例子有: tftp, bootp 等。
? ?那么,數(shù)據(jù)包既然會丟失,怎樣能保證程序能夠正常工作呢?
? ?? ? 事實上,每個使用UDP的程序都要有自己的對數(shù)據(jù)進(jìn)行確認(rèn)的協(xié)議。
? ?? ?? ???比如, TFTP 協(xié)議定義了對于每一個發(fā)送出去的數(shù)據(jù)包,遠(yuǎn)程在接受到之后都要回送一個數(shù)據(jù)包告訴本地程序:“我已經(jīng)拿到了!”(一個 “ACK” 包)。如果數(shù)據(jù)包發(fā)的送者在5 秒內(nèi)沒有的得到回應(yīng),它就會重新發(fā)送這個數(shù)據(jù)包直到數(shù)據(jù)包接受者回送了 “ACK” 信號。這些知識對編寫一個使用UDP 協(xié)議的程序員來說是非常必要的。
? ?無連接服務(wù)器一般都是面向事務(wù)處理的,一個請求一個應(yīng)答就完成了客戶程序與服務(wù)程序之間的相互作用。
? ?面向連接服務(wù)器處理的請求往往比較復(fù)雜,不是一來一去的請求應(yīng)答所能解決的,而且往往是并發(fā)服務(wù)器
? ?套接字工作過程如下:
? ?? ?? ?服務(wù)器首先啟動
? ?? ?? ?通過調(diào)用socket()建立一個套接字,
? ?? ?? ?然后調(diào)用bind()將該套接字和本地網(wǎng)絡(luò)地址聯(lián)系在一起,
? ?? ?? ?再調(diào)用listen()使套接字做好偵聽的準(zhǔn)備,并規(guī)定它的請求隊列的長度,
? ?? ?? ?之后就調(diào)用accept()來接收連接。
? ?? ?? ?客戶在建立套接字
? ?? ?? ?然后就可調(diào)用connect()和服務(wù)器建立連接。

? ?? ?? ?客戶機和服務(wù)器之間就可以通過調(diào)用read()和write()來發(fā)送和接收數(shù)據(jù)。
? ?? ?? ?最后,待數(shù)據(jù)傳送結(jié)束后,雙方調(diào)用close()關(guān)閉套接字。
對流式套接字你所需要做的只是調(diào)用send() 函數(shù)來發(fā)送數(shù)據(jù)。而對于數(shù)據(jù)報套接字,你需要自己加個信息頭,然后調(diào)用sendto() 函數(shù)把數(shù)據(jù)發(fā)送出去
??原始套接字
? ???原始套接字主要用于一些協(xié)議的開發(fā),可以進(jìn)行比較底層的操作。它功能強大,但是沒有上面介紹的兩種套接字使用方便,一般的程序也涉及不到原始套接字
套接字結(jié)構(gòu)
struct sockaddr
這個結(jié)構(gòu)用來存儲套接字地址。
數(shù)據(jù)定義:
struct sockaddr
{
? ? unsigned short sa_family;??/* address族, AF_xxx */
? ? char sa_data[14];? ?? ?? ?? ???/* 14 bytes的協(xié)議地址 */
};
sa_family??一般來說,都是 “AF_INET”。
sa_data? ? 包含了一些遠(yuǎn)程電腦的地址、端口和套接字的數(shù)目,它里面的數(shù)據(jù)是雜溶在一切的。
為了處理struct sockaddr, 程序員建立了另外一個相似的結(jié)構(gòu)struct sockaddr_in (“in” 代表 “Internet”):
struct sockaddr_in
{
? ?short? ???int? ?? ? sin_family;? ?? ?? ???/* Internet地址族 */
? ?unsigned??short int sin_port;? ?? ? /* 端口號 */
? ?struct? ? in_addr? ?sin_addr;? ?? ?? ?/* Internet地址 */
? ?unsigned??char? ?? ?sin_zero[8];? ?/* 添0(和struct sockaddr一樣大小)*/
};
注意:
? ? 1)這個結(jié)構(gòu)提供了方便的手段來訪問socket address(struct sockaddr)結(jié)構(gòu)中的每一個元素。
? ? 2)sin_zero[8] 是為了是兩個結(jié)構(gòu)在內(nèi)存中具有相同的尺寸
? ?? ?? ?? ?? ?? ?要把sin_zero 全部設(shè)成零值(使用bzero()或memset()函數(shù))。
? ? 3)一個指向struct sockaddr_in 的指針可以聲明指向一個sturct sockaddr 的結(jié)構(gòu)。所以雖然socket() 函數(shù)需要一個structaddr * ,你也可以給他一個sockaddr_in * 。
? ? 4)在struct??sockaddr_in 中,sin_family 相當(dāng)于 在struct sockaddr 中的sa_family,需要設(shè)成 “AF_INET”。
? ? 5)一定要保證sin_port 和sin_addr 必須是網(wǎng)絡(luò)字節(jié)順序(見下節(jié))!
2.struct in_addr??( 因特網(wǎng)地址 (a structure for historical reasons) )
? ?struct in_addr
? ?{
? ?? ? unsigned long s_addr;
? ?};
? ?如果你聲明了一個 "ina" 作為一個struct sockaddr_in 的結(jié)構(gòu), 那么“ina.sin_addr.s_addr”就是4 個字節(jié)的IP 地址(按網(wǎng)絡(luò)字節(jié)順序排放)。
? ?需要注意的是,即使你的系統(tǒng)仍然使用聯(lián)合而不是結(jié)構(gòu)來表示struct in_addr,你仍然可以用上面的方法得到4 個字節(jié)的IP 地址(一些 #defines 幫了你的忙)
網(wǎng)絡(luò)字節(jié)順序
? ?因為每一個機器內(nèi)部對變量的字節(jié)存儲順序不同(有的系統(tǒng)是高位在前,底位在后,而有的系統(tǒng)是底位在前,高位在后),而網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)大家是一定要統(tǒng)一順序的。
? ?所以對與內(nèi)部字節(jié)表示順序和網(wǎng)絡(luò)字節(jié)順序不同的機器,就一定要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換(比如IP 地址的表示,端口號的表示)。
? ?但是內(nèi)部字節(jié)順序和網(wǎng)絡(luò)字節(jié)順序相同的機器該怎么辦呢?是這樣的:它們也要調(diào)用轉(zhuǎn)換函數(shù),但是真正轉(zhuǎn)換還是不轉(zhuǎn)換是由系統(tǒng)函數(shù)自己來決定的。
? ?有關(guān)的轉(zhuǎn)化函數(shù)
? ?? ?我們通常使用的有兩種數(shù)據(jù)類型:短型(兩個字節(jié))和長型(四個字節(jié))。
? ?? ?下面介紹的這些轉(zhuǎn)換函數(shù)對于這兩類的無符號整型變量都可以進(jìn)行正確的轉(zhuǎn)換。
? ?? ?如果你想將一個短型數(shù)據(jù)從主機字節(jié)順序轉(zhuǎn)換到網(wǎng)絡(luò)字節(jié)順序的話,有這樣一個函數(shù)htons:
? ?? ?? ?它是以“h”開頭的(代表“主機”);
? ?? ?? ?緊跟著它的是“to”,代表“轉(zhuǎn)換到”;
? ?? ?? ?然后是“n”代表“網(wǎng)絡(luò)”;
? ?? ?? ?最后是“s”,代表“短型數(shù)據(jù)”。
? ?? ?? ?H-to-n-s,就是htons() 函數(shù)(可以使用Hostto Network Short 來助記)
? ?? ?你可以使用 “n”,“h”,“to”,“s”,“l(fā)”的任意組合.當(dāng)然,你要在可能的情況下進(jìn)行組合。比如,系統(tǒng)是沒有stolh() 函數(shù)的(Short to Long Host?)。
? ?? ???下面給出套接字字節(jié)轉(zhuǎn)換程序的列表:
? ?? ?? ? htons()——“Host to Network Short” 主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(對無符號短型進(jìn)行操作4 bytes)
? ?? ?? ? htonl()——“Host to Network Long” 主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(對無符號長型進(jìn)行操作8 bytes)
? ?? ?? ? ntohs()——“Network to Host Short “ 網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(對無符號短型進(jìn)行操作4 bytes)
? ?? ?? ? ntohl()——“Network to Host Long “ 網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(對無符號長型進(jìn)行操作8 bytes)
? ???在struct sockaddr_in 中的sin_addr 和sin_port 他們的字節(jié)順序都是網(wǎng)絡(luò)字節(jié)順序,而sin_family 卻不是網(wǎng)絡(luò)字節(jié)順序的。為什么呢?
? ?? ???這個是因為sin_addr 和sin_port 是從IP 和UDP 協(xié)議層取出來的數(shù)據(jù),而在IP 和UDP協(xié)議層,是直接和網(wǎng)絡(luò)相關(guān)的,所以,它們必須使用網(wǎng)絡(luò)字節(jié)順序。
? ?? ???然而, sin_family 域只是內(nèi)核用來判斷struct sockaddr_in 是存儲的什么類型的數(shù)據(jù),并且, sin_family 永遠(yuǎn)也不會被發(fā)送到網(wǎng)絡(luò)上,所以可以使用主機字節(jié)順序來存儲
socket() 函數(shù)
? ?
? ?/**
? ?*
? ?* 取得套接字描述符!(記得我們以前說過的嗎?它其實就是一個文件描述符)
? ?*
? ?* domain? ?需要被設(shè)置為 “AF_INET”,就像上面的struct sockaddr_in。
? ?* type? ???參數(shù)告訴內(nèi)核這個socket 是什么類型,“SOCK_STREAM”或是“SOCK_DGRAM”。
? ?* protocol 通常為0
? ?*
? ?* return? ?如果發(fā)生錯誤,socket()函數(shù)返回 –1 。全局變量errno 將被設(shè)置為錯誤代碼。
? ?*
? ?*/
? ?#include
? ?#include
? ?int socket(int domain , int type , int protocol)
? ?示例:
? ?if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
? ?{
? ?? ???perror("create sock");
? ?? ???return -1;
? ?}
? ?else
? ?{
? ?? ?// printf("socket created...\n");
? ?}
bind() 函數(shù)
/**
*
* 為套接字綁定一個端口號
*
* 當(dāng)你需要進(jìn)行端口監(jiān)聽listen()操作,等待接受一個連入請求的時候,
* 一般都需要經(jīng)過這一步。比如網(wǎng)絡(luò)泥巴(MUD),Telnet a.b.c.d 4000
*
* 如果你只是想進(jìn)行連接一臺服務(wù)器,也就是進(jìn)行connect() 操作的時候,這一步并不是必須的。
*
*
* sockfd? ? 是由socket()函數(shù)返回的套接字描述符
* my_addr? ?是一個指向struct sockaddr 的指針,包含有關(guān)你的地址的信息:名稱、端口和IP 地址。
* addrlen? ?可以設(shè)置為sizeof(struct sockaddr)
*
* return? ? 調(diào)用錯誤的時候,返回 -1 作為錯誤發(fā)生的標(biāo)志。errno 的值為錯誤代碼。
*
*/
#include
#include
int bind (int sockfd , struct sockaddr *my_addr , int addrlen) ;
示例:
#include
#include
#include
#define??MYPORT 4000
main()
{
??int sockfd ;
??struct sockaddr_in my_addr ;
??sockfd? ?? ?? ?? ?? ?? ?= socket(AF_INET, SOCK_STREAM, 0); /* 在你自己的程序中要進(jìn)行錯誤檢查!! */
??my_addr.sin_family? ?? ?= AF_INET ;? ?? ???/* 主機字節(jié)順序 */
??my_addr.sin_port? ?? ???= htons(MYPORT);? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
??my_addr.sin_addr.s_addr = inet_addr("166.111.69.52") ;
??bzero(&(my_addr.sin_zero), 8);? ?? ?? ?? ? /* 將整個結(jié)構(gòu)剩余部分?jǐn)?shù)據(jù)設(shè)為0 */
??bind (sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));??/* 不要忘記在你自己的程序中加入判斷bind 錯誤的代碼!! */
??注意:
? ? my_addr.sin_port? ?? ?? ?是網(wǎng)絡(luò)字節(jié)順序, 短整型
? ? my_addr.sin_addr.s_addr??也是網(wǎng)絡(luò)字節(jié)順序。
??最后,bind()可以在程序中自動獲取你自己的IP 地址和端口。
? ? my_addr.sin_port = 0 ;? ?? ?? ?? ?? ???/* 隨機選擇一個端口 */
? ? my_addr.sin_addr.s_addr = INADDR_ANY ; /* 使用自己的地址 */
? ? 如上,通過設(shè)置my_addr.sin_port 為0,bind()可以知道你要它幫你選擇合適的端口;
? ? 通過設(shè)置my_addr.sin_addr.s_addr 為INADDR_ANY,bind()知道你要它將s_addr 填充為運行這個進(jìn)程的機器的IP。
? ? 這一切都可以要求bind()來自動的幫助你完成。
? ? 如果你注意到了一些細(xì)節(jié)的話,你可能會發(fā)現(xiàn)我并沒有將INADDR_ANY 轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序!是這樣的,INADDR_ANY的值為0,0 就是0,無論用什么順序排列位的順序,它都是不變的。
? ? 有讀者會想了,因為我用的INADDR_ANY 是一個#define,那么如果將我的程序移植到另外一個系統(tǒng),假如那里的INADDR_ANY是這樣定義的:
? ?? ? #define INADDR_ANY 100,
? ?? ? 那么我的程序不是就會不運行了嗎?那么下面這段代碼就OK 了:
? ?? ? my_addr.sin_port = htons(0);? ?? ?? ?? ?? ?? ? /* 隨機選擇一個未用的端口 */
? ?? ? my_addr.sin_addr.s_addr = htonl(INADDR_ANY) ;??/* 使用自己的IP地址 */
? ? 現(xiàn)在我們已經(jīng)是這么的嚴(yán)謹(jǐn),對于任何數(shù)值的INADDR_ANY調(diào)用bind 的時候就都不會有麻煩了。
? ?另外一件必須指出的事情是:
? ?? ? 當(dāng)你調(diào)用bind()的時候,不要把端口數(shù)設(shè)置的過小!小于1024 的所有端口都是保留下來作為系統(tǒng)使用端口的,沒有root 權(quán)利無法使用。你可以使用1024 以上的任何端口,一直到65535 :你所可能使用的最大的端口號(當(dāng)然,你還要保證你所希望使用的端口沒有被其他程序所使用)。
? ?最后注意有關(guān)bind()的是:
? ?? ? 有時候你并不一定要調(diào)用bind()來建立網(wǎng)絡(luò)連接。比如你只是想連接到一個遠(yuǎn)程主機上面進(jìn)行通訊,你并不在乎你究竟是用的自己機器上的哪個端口進(jìn)行通訊(比如Telnet),那么你可以簡單的直接調(diào)用connect()函數(shù),connect()將自動尋找出本地機器上的一個未使用的端口,然后調(diào)用 bind()來將其socket 綁定到那個端口上。
connect() 函數(shù)
/*
*
* sockfd? ???套接字文件描述符,由socket()函數(shù)返回的
* serv_addr??是一個存儲遠(yuǎn)程計算機的IP 地址和端口信息的結(jié)構(gòu)
* addrlen? ? 應(yīng)該是sizeof(struct sockaddr)
*
* return? ???如果發(fā)生了錯誤(比如無法連接到遠(yuǎn)程主機,或是遠(yuǎn)程主機的指定端口無法進(jìn)行連接等)它將會返回錯誤值 -1
*? ?? ?? ?? ?全局變量errno將會存儲錯誤代碼
*
*
*/
#include
#include
int connect (int sockfd, struct sockaddr *serv_addr, int addrlen);
示例:
#include
#include
#include
#define DEST_IP “166.111.69.52”
#define DEST_PORT 23
main()
{
? ?int sockfd ;
? ?/* 將用來存儲遠(yuǎn)程信息 */
? ?struct sockaddr_in dest_addr ;
? ?/* 注意在你自己的程序中進(jìn)行錯誤檢查!! */
? ?sockfd = socket(AF_INET, SOCK_STREAM, 0);
? ?/* 主機字節(jié)順序 */
? ?dest_addr.sin_family = AF_INET ;
? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
? ?dest_addr.sin_port = htons(DEST_PORT(;
? ?dest_addr.sin_addr.s_addr = inet_addr(DEST_IP);
? ?/* 將剩下的結(jié)構(gòu)中的空間置0 */
? ?bzero(&(dest_addr.sin_zero), 8);
? ?/* 不要忘記在你的代碼中對connect()進(jìn)行錯誤檢查!! */
? ?connect(sockfd, (struct sockaddr *)&dest_addr, sizeof(struct sockaddr));
? ?注意我們沒有調(diào)用bind()函數(shù)。基本上,我們并不在乎我們本地用什么端口來通訊,是不是?我們在乎的是我們連到哪臺主機上的哪個端口上。Linux 內(nèi)核自動為我們選擇了一個沒有被使用的本地端口。

listen() 函數(shù)

/*
*
* 等待別人連接,進(jìn)行系統(tǒng)偵聽請求
* 當(dāng)有人連接你的時候,你有兩步需要做:
*? ???通過listen()函數(shù)等待連接請求
*? ???然后使用accept()函數(shù)來處理
*
* 那么我們需要指定本地端口了,因為我們是等待別人的連接。所以,在listen()函數(shù)調(diào)用之前,我們需要使用bind() 函數(shù)來指定使用本地的哪一個端口數(shù)值
* 如果你想在一個端口上接受外來的連接請求的話,那么函數(shù)的調(diào)用順序為:
*??socket();
*??bind();
*??listen();
*
* sockfd? ? 是一個套接字描述符,由socket()系統(tǒng)調(diào)用獲得
* backlog? ?是未經(jīng)過處理的連接請求隊列可以容納的最大數(shù)目(每一個連入請求都要進(jìn)入一個連入請求隊列,等待listen 的程序調(diào)用accept()函數(shù)來接受這個連接。當(dāng)系統(tǒng)還沒有調(diào)用accept()函數(shù)的時候,如果有很多連接,那么本地能夠等待的最大數(shù)目就是 backlog 的數(shù)值。你可以將其設(shè)成5 到10 之間的數(shù)值(推薦))
*
*
* return? ? 錯誤返回-1, 并設(shè)置全局錯誤代碼變量errno
*/
#include
int listen(int sockfd, int backlog);
accept()函數(shù)
/*
* 當(dāng)調(diào)用它的時候,大致過程是下面這樣的:
*? ???有人從很遠(yuǎn)很遠(yuǎn)的地方嘗試調(diào)用connect()來連接你的機器上的某個端口(當(dāng)然是你已經(jīng)在listen()的)
*? ???他的連接將被listen 加入等待隊列等待accept()函數(shù)的調(diào)用
*? ???你調(diào)用accept()函數(shù),告訴他你準(zhǔn)備連接
*
* sockfd? ?是正在listen() 的一個套接字描述符
* addr? ???一般是一個指向struct sockaddr_in 結(jié)構(gòu)的指針;里面存儲著遠(yuǎn)程連接過來的計算機的信息(比如遠(yuǎn)程計算機的IP 地址和端口)
* addrlen??是一個本地的整型數(shù)值,在它的地址傳給accept() 前它的值應(yīng)該是sizeof(struct sockaddr_in);accept()不會在addr 中存儲多余addrlen bytes 大小的數(shù)據(jù)。如果accept()函數(shù)在addr 中存儲的數(shù)據(jù)量不足addrlen,則accept()函數(shù)會改變addrlen 的值來反應(yīng)這個情況。
*
*
* return? ?accept()函數(shù)將回返回一個新的套接字描述符,這個描述符就代表了這個連接
*? ?? ?? ? 這時候你有了兩個套接字描述符:
*? ?? ?? ?? ? 返回給你的那個就是和遠(yuǎn)程計算機的連接, 這時候你所得到的那個新的套接字描述符就可以進(jìn)行send()操作和recv()操作了。
*? ?? ?? ?? ? 而第一個套接字描述符仍然在你的機器上原來的那個端口上listen()
*
*? ?? ?? ? -1 來表明調(diào)用失敗,同時全局變量errno 將會存儲錯誤代碼
*/
#include
int accept(int sockfd, void *addr, int *addrlen);
示例:
#include
#include
#include
/* 用戶連接的端口號 */
#define MYPORT 4000
/* 等待隊列中可以存儲多少個未經(jīng)過accept()處理的連接 */
#define BACKLOG 10
main()
{
? ?/* 用來監(jiān)聽網(wǎng)絡(luò)連接的套接字sock_fd,用戶連入的套接字使用new_fd */
? ?int sockfd, new_fd ;
? ?/* 本地的地址信息 */
? ?struct sockaddr_in my_addr ;
? ?/* 連接者的地址信息 */
? ?struct sockaddr_in their_addr ;
? ?int sin_size;
? ?/* 記得在自己的程序中這部分要進(jìn)行錯誤檢查! */
? ?sockfd = socket(AF_INET, SOCK_STREAM, 0) ;
? ?/* 主機字節(jié)順序 */
? ?my_addr.sin_family = AF_INET ;
? ?/* 網(wǎng)絡(luò)字節(jié)順序,短整型 */
? ?my_addr.sin_port = htons(MYPORT) ;
? ?/* 自動賦值為自己的IP */
? ?my_addr.sin_addr.s_addr = INADDR_ANY ;
? ?/* 將結(jié)構(gòu)中未使用部分全部清零 */
? ?bzero(&(my_addr.sin_zero), 8) ;
? ?/* 不要忘記在你自己的程序中下面的程序調(diào)用需要進(jìn)行錯誤檢測!!*/
? ?bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

? ?listen(sockfd, BACKLOG);
? ?sin_size = sizeof(struct sockaddr_in);
? ?new_fd = accept(sockfd, &their_addr, &sin_size);
send()、recv()函數(shù)
/*
*
*??這兩個函數(shù)是最基本的,通過連接的套接字流進(jìn)行通訊的函數(shù)
*??如果你想使用無連接的使用者數(shù)據(jù)報的話,請參sendto() 和recvfrom() 函數(shù)。
*
*??sockfd 是代表你與遠(yuǎn)程程序連接的套接字描述符。
*??msg? ? 是一個指針,指向你想發(fā)送的信息的地址。
*??len? ? 是你想發(fā)送信息的長度
*??flags??發(fā)送標(biāo)記。一般都設(shè)為0(你可以查看send 的man pages 來獲得其他的參數(shù)值并且明白各個參數(shù)所代表的含義)
*??
*??return??函數(shù)在調(diào)用后會返回它真正發(fā)送數(shù)據(jù)的長度
*? ?? ?? ? -1??如果發(fā)生錯誤,錯誤代碼存儲在全局變量errno
*
*/
#include
#include
int send(int sockfd, const void *msg, int len, int flags);
示例:
char *msg = "Hello! World! ";
int len, bytes_sent;
len = strlen(msg);
bytes_sent = send(sockfd, msg, len, 0);
注意:
? ?send() 所發(fā)送的數(shù)據(jù)可能少于你給它的參數(shù)所指定的長度!
? ?因為如果你給send()的參數(shù)中包含的數(shù)據(jù)的長度遠(yuǎn)遠(yuǎn)大于send()所能一次發(fā)送的數(shù)據(jù),則send()函數(shù)只發(fā)送它所能發(fā)送的最大數(shù)據(jù)長度,然后它相信你會把剩下的數(shù)據(jù)再次調(diào)用它來進(jìn)行第二次發(fā)送。
? ?所以,記住如果send()函數(shù)的返回值小于len 的話,則你需要再次發(fā)送剩下的數(shù)據(jù)。
? ?幸運的是,如果包足夠小(小于1K),那么send()一般都會一次發(fā)送光的。
recv()函數(shù)
/*
*
*??sockfd??是你要讀取數(shù)據(jù)的套接字描述符
*??buf? ???是一個指針,指向你能存儲數(shù)據(jù)的內(nèi)存緩存區(qū)域
*??len? ???是緩存區(qū)的最大尺寸
*??flags? ?是recv() 函數(shù)的一個標(biāo)志,一般都為0 (具體的其他數(shù)值和含義請參考recv()的man pages)
*
*
*??返回? ? 它所真正收到的數(shù)據(jù)的長度(也就是存到buf 中數(shù)據(jù)的長度)
*
*? ?? ?? ? -1? ? 則代表發(fā)生了錯誤(比如網(wǎng)絡(luò)以外中斷、對方關(guān)閉了套接字連接等),全局變量errno 里面存儲了錯誤代碼
*/
#include
#include
int recv(int sockfd, void *buf, int len, unsigned int flags);
sendto() 和recvfrom() 函數(shù)
/*
* 這兩個函數(shù)是進(jìn)行無連接的UDP 通訊時使用的。
* 使用這兩個函數(shù),則數(shù)據(jù)會在沒有建立過任何連接的網(wǎng)絡(luò)上傳輸。因為數(shù)據(jù)報套接字無法對遠(yuǎn)程主機進(jìn)行連接
*
* sockfd??是代表你與遠(yuǎn)程程序連接的套接字描述符
* msg? ???是一個指針,指向你想發(fā)送的信息的地址
* len? ???是你想發(fā)送信息的長度
* flags? ?發(fā)送標(biāo)記。一般都設(shè)為0 (你可以查看send 的man pages 來獲得其他的參數(shù)值并且明白各個參數(shù)所代表的含義)
* to? ?? ?是一個指向struct sockaddr 結(jié)構(gòu)的指針,里面包含了遠(yuǎn)程主機的IP 地址和端口數(shù)據(jù)
* tolen? ?只是指出了struct sockaddr 在內(nèi)存中的大小sizeof(struct sockaddr)
*
* return??sendto()返回它所真正發(fā)送的字節(jié)數(shù)(當(dāng)然也和send()一樣,它所真正發(fā)送的字節(jié)數(shù)可能小于你所給它的數(shù)據(jù)的字節(jié)數(shù))
*? ?? ?? ?-1 表示出錯? ?同時全局變量errno 存儲了錯誤代碼
*/
#include
#include
int sendto(int sockfd, const void *msg, int len, unsigned int flags, const struct sockaddr *to, int tolen);
recvfrom()函數(shù)
/*
*
* sockfd??是你要讀取數(shù)據(jù)的套接字描述符
* buf? ???是一個指針,指向你能存儲數(shù)據(jù)的內(nèi)存緩存區(qū)域
* len? ???是緩存區(qū)的最大尺寸
* flags? ?是recv() 函數(shù)的一個標(biāo)志,一般都為0 (具體的其他數(shù)值和含義請參考recv()的man pages)
* from? ? 是一個本地指針,指向一個struct sockaddr 的結(jié)構(gòu)(里面存有源IP 地址和端口數(shù))
* fromlen 是一個指向一個int 型數(shù)據(jù)的指針,它的大小應(yīng)該是sizeof (struct sockaddr).當(dāng)函數(shù)返回的時候,formlen 指向的數(shù)據(jù)是form 指向的struct sockaddr 的實際大小.
*? ?? ?? ?如果一個信息大得緩沖區(qū)都放不下,那么附加信息將被砍掉。該調(diào)用可以立即返回,也可以永久的等待。這取決于你把flags 設(shè)置成什么類型。你甚至可以設(shè)置超時(timeout)值。
*
*
* return??返回它接收到的字節(jié)數(shù),如果發(fā)生了錯誤,它就返回–1 ,全局變量errno存儲了錯誤代碼
*
*/
#include
#include
int recvfrom(int sockfd, void *buf, int len, unsigned int flags, struct sockaddr *from, int *fromlen);
注意:
? ?如果你使用cnnect()連接到了一個數(shù)據(jù)報套接字的服務(wù)器程序上,那么你就可以使用send() 和recv() 函數(shù)來傳輸你的數(shù)據(jù).
? ?不要以為你在使用一個流式的套接字,你所使用的仍然是一個使用者數(shù)據(jù)報的套接字,只不過套接字界面在send() 和recv()的時候自動幫助你加上了目標(biāo)地址,目標(biāo)端口的信息.
close()和shutdown()函數(shù)
/*
* 程序進(jìn)行網(wǎng)絡(luò)傳輸完畢后,你需要關(guān)閉這個套接字描述符所表示的連接。實現(xiàn)這個非常簡單,只需要使用標(biāo)準(zhǔn)的關(guān)閉文件的函數(shù):close()。
* 執(zhí)行close()之后,套接字將不會在允許進(jìn)行讀操作和寫操作。任何有關(guān)對套接字描述符進(jìn)行讀和寫的操作都會接收到一個錯誤。
*
*/
close(sockfd);
/*
* 如果你想對網(wǎng)絡(luò)套接字的關(guān)閉進(jìn)行進(jìn)一步的操作的話,你可以使用函數(shù)shutdown()
* 它允許你進(jìn)行單向的關(guān)閉操作,或是全部禁止掉。
*
* 如果你在一個未連接的數(shù)據(jù)報套接字上使用shutdown() 函數(shù),它將什么也不做.
*
* sockfd 是一個你所想關(guān)閉的套接字描述符
* how 可以取下面的值。
*? ???0 表示不允許以后數(shù)據(jù)的接收操;
*? ???1 表示不允許以后數(shù)據(jù)的發(fā)送操作;
*? ???2 表示和close()一樣,不允許以后的任何操作(包括接收,發(fā)送數(shù)據(jù))
*
* return??0 執(zhí)行成功
*? ?? ???-1 執(zhí)行失敗, 全局變量errno 中存儲了錯誤代碼.
*? ?
*/
#include
int shutdown(int sockfd, int how);
setsockopt() 和getsockopt() 函數(shù)
Linux 所提供的socket 庫含有一個錯誤(bug)。
??此錯誤表現(xiàn)為你不能為一個套接字重新啟用同一個端口號,即使在你正常關(guān)閉該套接字以后。
??例如,比方說,你編寫一個服務(wù)器在一個套接字上等待的程序.服務(wù)器打開套接字并在其上偵聽是沒有問題的。無論如何,總有一些原因(不管是正常還是非正常的結(jié)束程序)使你的程序需要重新啟動。然而重啟動后你就不能把它綁定在原來那個端口上了。從bind()系統(tǒng)調(diào)用返回的錯誤代碼總是報告說你試圖連接的端口已經(jīng)被別的進(jìn)程所綁定。
??問題就是Linux 內(nèi)核在一個綁定套接字的進(jìn)程結(jié)束后從不把端口標(biāo)記為未用。在大多數(shù)Linux/UNIX 系統(tǒng)中,端口可以被一個進(jìn)程重復(fù)使用,甚至可以被其它進(jìn)程使用。
??在Linux 中繞開這個問題的辦法是,當(dāng)套接字已經(jīng)打開但尚未有連接的時候用setsockopt()系統(tǒng)調(diào)用在其上設(shè)定選項(options)。
??setsockopt() 調(diào)用設(shè)置選項而getsockopt()從給定的套接字取得選項。
這里是這些調(diào)用的語法:
/*
*
*
* sockfd 必須是一個已打開的套接字
* level 是函數(shù)所使用的協(xié)議標(biāo)準(zhǔn)(protocol level)(TCP/IP 協(xié)議使用IPPROTO_TCP,套接字標(biāo)準(zhǔn)的選項實用SOL_SOCKET)
* name 選項在套接字說明書中(man page)有詳細(xì)說明
* value 指向為getsockopt()函數(shù)所獲取的值,setsockopt()函數(shù)所設(shè)置的值的地址
* optlen 指針指向一個整數(shù),該整數(shù)包含參數(shù)以字節(jié)計算的長度
*
*
*
*
*
*/
#include
#include
int getsockopt(int sockfd, int level, int name, char *value, int *optlen);
int setsockopt(int sockfd, int level, int name, char *value, int *optlen);
當(dāng)你打開一個套接字時必須同時用下面的代碼段來調(diào)用setsockopt()函數(shù):
/* 設(shè)定參數(shù)數(shù)值 */
opt = 1;
len = sizeof(opt);
/* 設(shè)置套接字屬性 */
setsockopt(sockfd,SOL_SOCKET,SO_REUSEADDR,&opt,&len);
getpeername()函數(shù)
/*
* 這個函數(shù)可以取得一個已經(jīng)連接上的套接字的遠(yuǎn)程信息(比如IP 地址和端口),告訴你在遠(yuǎn)程和你連接的究竟是誰
*
* 當(dāng)你擁有了遠(yuǎn)程連接用戶的IP 地址,你就可以使用inet_ntoa() 或gethostbyaddr()來輸出信息或是做進(jìn)一步的處理
*
* sockfd??是你想取得遠(yuǎn)程信息的那個套接字描述符
* addr? ? 是一個指向struct sockaddr (或是struct sockaddr_in)的指針
* addrlen 是一個指向int 的指針,應(yīng)該賦于sizeof(struct sockaddr)的大小
*
*
* return??錯誤,函數(shù)將返回 –1 ,并且錯誤代碼儲存在全局變量errno 中
*
*/
#include
int getpeername(int sockfd, struct sockaddr *addr, int *addrlen);
gethostname()函數(shù)
/*
* 可以取得本地主機的信息,它返回正在執(zhí)行它的計算機的名字
* 返回的這個名字可以被gethostbyname()函數(shù)使用,由此可以得到本地主機的IP 地址
*
* hostname??是一個指向字符數(shù)組的指針,當(dāng)函數(shù)返回的時候,它里面的數(shù)據(jù)就是本地的主機的名字
* size? ?? ?是hostname 指向的數(shù)組的長度
*
*
* return? ? 成功執(zhí)行,它返回0
*? ?? ?? ???錯誤,則返回–1,全局變量errno 中存儲著錯誤代碼
*
*/
#include
int gethostname(char *hostname, size_t size);
gethostbyname()函數(shù)
/*
*
* 網(wǎng)絡(luò)地址是以網(wǎng)絡(luò)字節(jié)順序存儲的
*
*
* return? ? 成功則返回指向結(jié)構(gòu)struct hostent的指針
*
? ?? ?? ?? ?#define h_addr h_addr_list[0]? ? //h_addr 是 h_addr_list 數(shù)組的第一個成員
? ?? ?? ?? ?struct hostent
? ?? ?? ?? ?{
? ?? ?? ?? ?? ?char *h_name;? ?? ? //是這個主機的正式名稱
? ?? ?? ?? ?? ?char **h_aliases;? ?//是一個以NULL(空字符)結(jié)尾的數(shù)組,里面存儲了主機的備用名稱
? ?? ?? ?? ?? ?int??h_addrtype;? ? //是返回地址的類型,一般來說是“AF_INET”
? ?? ?? ?? ?? ?int??h_length;? ?? ?//是地址的字節(jié)長度
? ?? ?? ?? ?? ?char **h_addr_list; //是一個以0 結(jié)尾的數(shù)組,存儲了主機的網(wǎng)絡(luò)地址
? ?? ?? ?? ?};
*
*
*? ?? ?? ???如果發(fā)生錯誤,它將會返回NULL(但是errno 并不代表錯誤代碼,h_errno 中存儲的才識錯誤代碼。參考下面的herror()函數(shù)
*/
struct hostent *gethostbyname(const char *name);
五種I/O 模式
----------------------------------------
在Linux/UNIX 下,有下面這五種I/O 操作方式:
? ?阻塞I/O
? ?非阻塞I/O
? ?I/O 多路復(fù)用
? ?信號驅(qū)動I/O(SIGIO)
? ?異步I/O
程序進(jìn)行輸入操作有兩步:
? ?等待有數(shù)據(jù)可以讀
? ?將數(shù)據(jù)從系統(tǒng)內(nèi)核中拷貝到程序的數(shù)據(jù)區(qū)。
對于一個對套接字的輸入操作:
? ???第一步一般來說是,等待數(shù)據(jù)從網(wǎng)絡(luò)上傳到本地,當(dāng)數(shù)據(jù)包到達(dá)的時候,數(shù)據(jù)將會從網(wǎng)絡(luò)層拷貝到內(nèi)核的緩存中;
? ???第二步是從內(nèi)核中把數(shù)據(jù)拷貝到程序的數(shù)據(jù)區(qū)中
.阻塞I/O 模式
? ???簡單的說,阻塞就是"睡眠"的同義詞
? ?? ?? ?如你運行上面的listener 的時候,它只不過是簡單的在那里等待接收數(shù)據(jù)。它調(diào)用recvfrom()函數(shù),但是那個時候(listener 調(diào)用recvfrom()函數(shù)的時候),它并沒有數(shù)據(jù)可以接收.所以recvfrom()函數(shù)阻塞在那里(也就是程序停在recvfrom()函數(shù)處睡大覺)直到有數(shù)據(jù)傳過來阻塞.你應(yīng)該明白它的意思。
? ???阻塞I/O 模式是最普遍使用的I/O 模式。大部分程序使用的都是阻塞模式的I/O 。
? ???缺省的,一個套接字建立后所處于的模式就是阻塞I/O 模式。
? ???對于一個UDP 套接字來說,數(shù)據(jù)就緒的標(biāo)志比較簡單:
? ?? ?? ?已經(jīng)收到了一整個數(shù)據(jù)報
? ?? ?? ?沒有收到。
? ???而TCP 這個概念就比較復(fù)雜,需要附加一些其他的變量
? ?? ?? ?一個進(jìn)程調(diào)用recvfrom ,然后系統(tǒng)調(diào)用并不返回知道有數(shù)據(jù)報到達(dá)本地系統(tǒng),然后系統(tǒng)將數(shù)據(jù)拷貝到進(jìn)程的緩存中。
? ?? ???(如果系統(tǒng)調(diào)用收到一個中斷信號,則它的調(diào)用會被中斷)我們稱這個進(jìn)程在調(diào)用recvfrom 一直到從recvfrom 返回這段時間是阻塞的。
? ?? ?? ?當(dāng)recvfrom正常返回時,我們的進(jìn)程繼續(xù)它的操作。
.非阻塞模式I/O
? ? 當(dāng)我們將一個套接字設(shè)置為非阻塞模式,我們相當(dāng)于告訴了系統(tǒng)內(nèi)核:“當(dāng)我請求的I/O 操作不能夠馬上完成,你想讓我的進(jìn)程進(jìn)行休眠等待的時候,不要這么做,請馬上返回一個錯誤給我。”
? ?
? ? 如我們開始對recvfrom 的三次調(diào)用,因為系統(tǒng)還沒有接收到網(wǎng)絡(luò)數(shù)據(jù),所以內(nèi)核馬上返回一個EWOULDBLOCK的錯誤。
? ? 第四次我們調(diào)用recvfrom 函數(shù),一個數(shù)據(jù)報已經(jīng)到達(dá)了,內(nèi)核將它拷貝到我們的應(yīng)用程序的緩沖區(qū)中,然后recvfrom 正常返回,我們就可以對接收到的數(shù)據(jù)進(jìn)行處理了。
??
? ? 當(dāng)一個應(yīng)用程序使用了非阻塞模式的套接字,它需要使用一個循環(huán)來不聽的測試是否一個文件描述符有數(shù)據(jù)可讀(稱做polling)。
? ? 應(yīng)用程序不停的polling 內(nèi)核來檢查是否I/O操作已經(jīng)就緒。這將是一個極浪費CPU 資源的操作。這種模式使用中不是很普遍
.I/O 多路復(fù)用 select()
? ? 在使用I/O 多路技術(shù)的時候,我們調(diào)用select()函數(shù)和poll()函數(shù),在調(diào)用它們的時候阻塞,而不是我們來調(diào)用recvfrom(或recv)的時候阻塞。
? ? 當(dāng)我們調(diào)用select 函數(shù)阻塞的時候,select 函數(shù)等待數(shù)據(jù)報套接字進(jìn)入讀就緒狀態(tài)。當(dāng)select 函數(shù)返回的時候,也就是套接字可以讀取數(shù)據(jù)的時候。這時候我們就可以調(diào)用recvfrom函數(shù)來將數(shù)據(jù)拷貝到我們的程序緩沖區(qū)中。
? ? 和阻塞模式相比較,select()和poll()并沒有什么高級的地方,而且,在阻塞模式下只需要調(diào)用一個函數(shù):讀取或發(fā)送,在使用了多路復(fù)用技術(shù)后,我們需要調(diào)用兩個函數(shù)了:先調(diào)用select()函數(shù)或poll()函數(shù),然后才能進(jìn)行真正的讀寫。
? ?
? ? 多路復(fù)用的高級之處在于,它能同時等待多個文件描述符,而這些文件描述符(套接字描述符)其中的任意一個進(jìn)入讀就緒狀態(tài),select()函數(shù)就可以返回
? ? 假設(shè)我們運行一個網(wǎng)絡(luò)客戶端程序,要同時處理套接字傳來的網(wǎng)絡(luò)數(shù)據(jù)又要處理本地的標(biāo)準(zhǔn)輸入輸出。在我們的程序處于阻塞狀態(tài)等待標(biāo)準(zhǔn)輸入的數(shù)據(jù)的時候,假如服務(wù)器端的程序被kill(或是自己Down 掉了),那么服務(wù)器程端的TCP 協(xié)議會給客戶端(我們這端)的TCP 協(xié)議發(fā)送一個FIN 數(shù)據(jù)代表終止連接。但是我們的程序阻塞在等待標(biāo)準(zhǔn)輸入的數(shù)據(jù)上,在它讀取套接字?jǐn)?shù)據(jù)之前(也許是很長一段時間),它不會看見結(jié)束標(biāo)志.我們就不能夠使用阻塞模式的套接字。
? ? I/O多路技術(shù)一般在下面這些情況中被使用:
? ?? ? 當(dāng)一個客戶端需要同時處理多個文件描述符的輸入輸出操作的時候(一般來說是標(biāo)準(zhǔn)的輸入輸出和網(wǎng)絡(luò)套接字), I/O 多路復(fù)用技術(shù)將會有機會得到使用。
? ?? ? 當(dāng)程序需要同時進(jìn)行多個套接字的操作的時候。
? ?? ? 如果一個TCP 服務(wù)器程序同時處理正在偵聽網(wǎng)絡(luò)連接的套接字和已經(jīng)連接好的套接字。
? ?? ? 如果一個服務(wù)器程序同時使用TCP 和UDP 協(xié)議。
? ?? ? 如果一個服務(wù)器同時使用多種服務(wù)并且每種服務(wù)可能使用不同的協(xié)議(比如inetd就是這樣的)。
??
? ? I/O 多路服用技術(shù)并不只局限與網(wǎng)絡(luò)程序應(yīng)用上。幾乎所有的程序都可以找到應(yīng)用I/O多路復(fù)用的地方。
fcntl()函數(shù)
? ???簡單的說,阻塞就是"睡眠"的同義詞.
? ???如你運行上面的listener 的時候,它只不過是簡單的在那里等待接收數(shù)據(jù)。它調(diào)用recvfrom()函數(shù),但是那個時候(listener 調(diào)用recvfrom()函數(shù)的時候),它并沒有數(shù)據(jù)可以接收.所以recvfrom()函數(shù)阻塞在那里(也就是程序停在recvfrom()函數(shù)處睡大覺)直到有數(shù)據(jù)傳過來阻塞.你應(yīng)該明白它的意思。
? ???當(dāng)你一開始建立一個套接字描述符的時候,系統(tǒng)內(nèi)核就被設(shè)置為阻塞狀態(tài)。如果你不想你的套接字描述符是處于阻塞狀態(tài)的,那么你可以使用函數(shù)fcntl()。
? ???#include
? ???#include
? ???int fcntl (int fd, int cmd, long arg);
示例:
? ???sockfd = socket(AF_INET, SOCK_STREAM, 0);
? ???fcntl(sockfd, F_SETFL, O_NONBLOCK);
? ???這樣將一個套接字設(shè)置為無阻塞模式后,你可以對套接字描述符進(jìn)行有效的“檢測”.
? ???如果你嘗試從一個沒有接收到任何數(shù)據(jù)的無阻塞模式的套接字描述符那里讀取數(shù)據(jù),那么讀取函數(shù)會馬上返回–1 代表發(fā)生錯誤,全局變量errno 中的值為EWOULDBLOCK。
? ???一般來說,這種無阻塞模式在某些情況下不是一個好的選擇。假如你的程序一直沒有接收到傳過來的數(shù)據(jù),那么你的程序就會進(jìn)行不停的循環(huán)來檢查是否有數(shù)據(jù)到來,浪費了大量的CPU 時間,而這些CPU 時間本來可以做其他事情的。
? ???另外一個比較好的檢測套接字描述符的方法是調(diào)用select()函數(shù)
套接字選擇項select()函數(shù)
/*
*
*??這個技術(shù)有一點點奇怪但是它對我們的程序確是非常有用的。
*??假想一下下面的情況:
*? ?? ?你寫的服務(wù)器程序想監(jiān)聽客戶端的連接,但是你同時又想從你以前已經(jīng)建立過的連接中來讀取數(shù)據(jù)。
*??你可能會說:“沒有問題,我不就是需要使用一個accept()函數(shù)和一對兒recv()函數(shù)嗎?”。
*??不要這么著急,你要想想,當(dāng)你調(diào)用accept()函數(shù)阻塞的時候,你還能調(diào)用recv()函數(shù)嗎?
*??“使用非阻塞套接字!”你可能會這么說。是的,你可以。但是如果你又不想浪費寶貴的CPU 時間,該怎么辦呢?
*??Select()函數(shù)可以幫助你同時監(jiān)視許多套接字。它會告訴你哪一個套接字已經(jīng)可以讀取數(shù)據(jù),
*??哪個套接字已經(jīng)可以寫入數(shù)據(jù),甚至你可以知道哪個套接字出現(xiàn)了錯誤,如果你想知道的話。
*
*??
*
* 當(dāng)select()函數(shù)返回的時候,readfds 將會被修改用來告訴你哪一個文件描述符你可以用來讀取數(shù)據(jù)。
*
* numfds? ?? ?? ?是readfds,writefds,exceptfds 中fd 集合中文件描述符中最大的數(shù)字加上1 也就是sockfd+1(因為標(biāo)準(zhǔn)輸入的文件描述符的值為0 ,所以其他任何的文件描述符都會比標(biāo)準(zhǔn)輸入的文件描述符大)。
*
* readfds? ?? ???中的fd 集合將由select 來監(jiān)視是否可以讀取,如果你想知道是是否可以從標(biāo)準(zhǔn)輸入和一些套接字(sockfd)中讀取數(shù)據(jù),你就可以把文件描述符和sockfd 加入readfds 中。
* writefds? ?? ? 中的fds 集合將由select 來監(jiān)視是否可以寫入
* exceptfds? ?? ?中的fds 集合將由select 來監(jiān)視是否有例外發(fā)生
* struct timeval 超時設(shè)置。
*? ?? ?? ?? ?? ?? ???一般來說,如果沒有任何文件描述符滿足你的要求,你的程序是不想永遠(yuǎn)等下去的.也許每隔1 分鐘你就想在屏幕上輸出信息:“hello!”。
*? ?? ?? ?? ?? ? 這個代表時間的結(jié)構(gòu)將允許你定義一個超時。
*? ?? ?? ?? ?? ? 在調(diào)用select()函數(shù)中,如果時間超過timeval 參數(shù)所代表的時間長度,
*? ?? ?? ?? ?? ? 而還沒有文件描述符滿足你的要求,那么select()函數(shù)將回返回,允許你進(jìn)行下面的操作。
*? ?? ?? ?? ?? ? 只需要將tv_sec 設(shè)置為你想等待的秒數(shù),然后設(shè)置tv_usec 為想等待的微秒數(shù)
*? ?? ?? ?? ?? ? (真正的時間就是tv_sec 所表示的秒數(shù)加上tv_usec 所表示的微秒數(shù)).注意,是微秒(百萬分之一)而不是毫秒.
*? ?? ?? ?? ?? ? 一秒有1,000 毫秒,一毫秒有1,000 微秒。所以,一秒有1,000,000 微秒.
*? ?? ?? ?? ?? ? 這個timeval 結(jié)構(gòu)定義如下:
*? ?? ?? ?? ?? ? struct timeval
*? ?? ?? ?? ?? ? {
*? ?? ?? ?? ?? ?? ???int tv_sec ;? ?//秒數(shù)
*? ?? ?? ?? ?? ?? ???int tv_usec ;??//微秒
*? ?? ?? ?? ?? ? };
*? ?? ?? ?? ?? ? 我們擁有了一個以微秒為單位的記時器!但是因為Linux 和UNIX 一樣,最小的時間片是100 微秒,所以不管你將tv_usec 設(shè)置的多小,實質(zhì)上記時器的最小單位是100微秒.
*
*? ?? ?? ?? ?? ? 如果你將struct timeval 設(shè)置為0,則select()函數(shù)將會立即返回,同時返回在你的集合中的文件描述符的狀態(tài)。
*
*? ?? ?? ?? ?? ? 如果你將timeout 這個參數(shù)設(shè)置為NULL,則select()函數(shù)進(jìn)入阻塞狀態(tài),除了等待到文件描述符的狀態(tài)變化,否則select()函數(shù)不會返回。
*
*
* return? ?? ???當(dāng)select()函數(shù)返回的時候,timeval 中的時間將會被設(shè)置為執(zhí)行為select()后還剩下的時間。
*
*
*
*/
#include
#include
#include
int select(int numfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
使用FD_ISSET() 宏,你可以選出select()函數(shù)執(zhí)行的結(jié)果。
在進(jìn)行更深的操作前,我們來看一看怎樣處理這些fd_sets。下面這些宏可以是專門進(jìn)行這類操作的:
??FD_ZERO(fd_set *set)? ?? ?? ???將一個文件描述符集合清零
??FD_SET(int fd, fd_set *set)? ? 將文件描述符fd 加入集合set 中。
??FD_CLR(int fd, fd_set *set)? ? 將文件描述符fd 從集合set 中刪除.
??FD_ISSET(int fd, fd_set *set)??測試文件描述符fd 是否存在于文件描述符set 中.
下面這段代碼演示了從標(biāo)準(zhǔn)輸入等待輸入等待2.5 秒.
#include
#include
#include
/* 標(biāo)準(zhǔn)輸入的文件描述符數(shù)值 */
#define STDIN 0
main()
{
? ?fd_set readfds;
? ?struct timeval tv;
? ?/* 設(shè)置等待時間為2 秒零500,000 微秒 */
? ?tv.tv_sec??= 2;
? ?tv.tv_usec = 500000;
? ?FD_ZERO(&readfds);
? ?FD_SET(STDIN, &readfds);
? ?/* 因為我們只想等待輸入,所以將writefds 和execeptfds 設(shè)為NULL */
? ?/* 程序?qū)谶@里等待2 秒零500,000 微秒,除非在這段時間中標(biāo)準(zhǔn)輸入有操作 */
? ?select(STDIN+1, &readfds, NULL, NULL, &tv);
? ?/* 測試STDIN 是否在readfds 集合中 */
? ?if (FD_ISSET(STDIN, &readfds))
? ?{
? ?? ?/* 在,則在標(biāo)準(zhǔn)輸入有輸入 */
? ?? ?printf(“A key was pressed!\n”);
? ?}
? ?else
? ?{
? ?? ?/* 不在,則在標(biāo)準(zhǔn)輸入沒有任何輸入 */
? ?? ?printf(“Timed out.\n”);
? ?}
}
在標(biāo)準(zhǔn)輸入上,你需要輸入回車后終端才會將輸入的信息傳給你的程序。所以如果你沒有輸入回車的話,程序會一直等待到超時。
對select()函數(shù)需要注意的最后一點:如果你的套接字描述符正在通過listen()函數(shù)偵聽等待一個外來的網(wǎng)絡(luò)連接,則你可以使用select()函數(shù)(將套接字描述符加入readfds 集合中)來測試是否存在一個未經(jīng)處理的新連接
DIN 是否在readfds 集合中 */
? ?if (FD_ISSET(STDIN, &readfds))
? ?{
? ?? ?/* 在,則在標(biāo)準(zhǔn)輸入有輸入 */
? ?? ?printf(“A key was pressed!\n”);
? ?}
? ?else
? ?{
? ?? ?/* 不在,則在標(biāo)準(zhǔn)輸入沒有任何輸入 */
? ?? ?printf(“Timed out.\n”);
? ?}
}
在標(biāo)準(zhǔn)輸入上,你需要輸入回車后終端才會將輸入的信息傳給你的程序。所以如果你沒有輸入回車的話,程序會一直等待到超時。
對select()函數(shù)需要注意的最后一點:如果你的套接字描述符正在通過listen()函數(shù)偵聽等待一個外來的網(wǎng)絡(luò)連接,則你可以使用select()函數(shù)(將套接字描述符加入readfds 集合中)來測試是否存在一個未經(jīng)處理的新連接


總結(jié)

以上是生活随笔為你收集整理的Socket编程知识必学/SELECT 编程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。