在前面的文章中,我們為了避免粘包問題,實現了一個readn函數讀取固定字節的數據。如果應用層協議的各字段長度固 定,用readn來讀是非常方便的。例如設計一種客戶端上傳文件的協議,規定前12字節表示文件名,超過12字節的文件名截 斷,不足12字節的文件名用'\0'補齊,從第13字節開始是文件內容,上傳完所有文件內容後關閉連接,服務器可以 先調用readn讀12個字節,根據文件名創建文件,然後在一個循環中調用read讀文件內容並存盤,循環結束的條件是read返 回0。
字段長度固定的協議往往不夠靈活,難以適應新的變化。前面講過的TFTP協議的各字段是可變長的,以'\0'為 分隔符,文件名可以任意長,再看blksize等幾個選項字段,TFTP協議並沒有規定從第m字節到第n字節是blksize的值,而是 把選項的描述信息“blksize”與它的值“512”一起做成一個可變長的字段。
因此,常見的應用層協議都是帶有可變長字段的,字段之間的分隔符用換行'\n'的比用'\0'的更常見 ,如HTTP協議。可變長字段的協議用readn來讀就很不方便了,為此我們實現一個類似於fgets的readline函數。
首先來看一個跟read 相似的系統函數recv。
#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
recv函數與read函數 類似,但只能讀取套接字描述符,而不能是一般的文件描述符,且多了一個標志參數。
flags參數比較重要的有兩個 ,一個是MSG_OOB,即讀取帶外數據時候的選項,tcp頭部有一個緊急指針16位的值。另一個是MSG_PEEK,即從緩沖區返回數 據但不清空緩沖區,這點與read是不同的。
下面使用封裝後的recv函數實現readline函數:
/* recv()只能讀寫套接字,而不能是一般的文件描述符 */ ssize_t recv_peek(int sockfd, void *buf, size_t len) { while (1) { int ret = recv(sockfd, buf, len, MSG_PEEK); // 設置標志位後讀取後不清除緩沖區 if (ret == -1 && errno == EINTR) continue; return ret; } } /* 讀到'\n'就返回,一行最多為maxline個字符 */ ssize_t readline(int sockfd, void *buf, size_t maxline) { int ret; int nread; char *bufp = buf; int nleft = maxline; int count = 0; while (1) { ret = recv_peek(sockfd, bufp, nleft); if (ret < 0) return ret; // 返回小於0表示失敗 else if (ret == 0) return ret; //返回0表示對方關閉連接了 nread = ret; int i; for (i = 0; i < nread; i++) { if (bufp[i] == '\n') { ret = readn(sockfd, bufp, i + 1); if (ret != i + 1) exit(EXIT_FAILURE); return ret + count; } } if (nread > nleft) exit(EXIT_FAILURE); nleft -= nread; ret = readn(sockfd, bufp, nread); if (ret != nread) exit(EXIT_FAILURE); bufp += nread; count += nread; } return -1;
在readline函數中,我們先用recv_peek”偷窺“ 一下現在緩沖區有多少個字符,然後查看是否存在換行符 '\n',如果存在,則使用readn連通換行符一起讀取,如果不存在,則也先將前面的數據讀取進bufp, 且移動bufp 的位置,回到while循環開頭,再從當前bufp位置窺看,注意,當我們調用readn讀取數據時,那部分緩沖區是會被清空的, 因為readn調用了read函數,還需注意一點是,如果第二次才讀取到了'\n',則先用count保存了第一次讀取的字符 個數,然後返回的ret需加上原先的數據大小。
使用 readline函數也可以認為是解決粘包問題的一個辦法,即以'\n'為結尾當作一條消息。對於服務器端來說 可以在前面的fork程序的基礎上把do_service函數更改如下:
void do_echoser(int conn) { char recvbuf[1024]; while (1) { memset(recvbuf, 0, sizeof(recvbuf)); int ret = readline(conn, recvbuf, 1024); if (ret == -1) ERR_EXIT("readline error"); else if (ret == 0) //客戶端關閉 { printf("client close\n"); break; } fputs(recvbuf, stdout); writen(conn, recvbuf, strlen(recvbuf)); } }
客戶端的更改也是類似的,不再贅述,測試輸出也是正常的。