所以,必須對創建的socket,啟用保活心跳,即Keepalive選項。
對於WIN32或者Linux平台來說,設置socket的Keepalive都很簡單,只需使用setsockopt設置SO_KEEPALIVE即可。
setsockopt的函數原型在Linux環境下為:
[cpp],在WIN32平台下為
- #include <sys/types.h>
- #include <sys/socket.h>
- int setsockopt(int s, int level, int optname,
- const void *optval,
- socklen_t optlen);
[cpp]
- #include <winsock2.h>
- int setsockopt(int s, int level, int optname,
- const char *optval,
- int optlen);
因為const void *可以接受const char *型的參數,所以為了代碼的跨平台編譯考慮,可以采用以下代碼來設置TCP的Keepalive選項。
[cpp]
- alive = 1;
- if (setsockopt
- (fd, SOL_SOCKET, SO_KEEPALIVE, (const char *) &alive,
- sizeof alive) != 0)
- {
- log_warn ("Set keep alive error: %s.\n", strerror (errno));
- return -1;
- }
這樣,對於TCP的連接,就啟用了系統默認值的保活心跳。
為什麼說是系統默認值的呢?因為有這樣幾個值,我們並沒有手動設置,是采用的系統默認值。即,
如果是Linux操作系統,這三個值分別為
[plain]
- # cat /proc/sys/net/ipv4/tcp_keepalive_time
- 7200
- # cat /proc/sys/net/ipv4/tcp_keepalive_intvl
- 75
- # cat /proc/sys/net/ipv4/tcp_keepalive_probes
- 9
這就是說,在Linux系統下,如果對於TCP的socket啟用了Keepalive選項,則會在7200秒(即兩個小時)沒有數據後,發起KEEPALIVE報文。如果沒有回應,則會在75秒後再次重試。如果重試9次均失敗,則認定連接已經失效。TCP的讀取操作,將返回0。
這對於我們大多數應用來說,前兩個時間值都有點太長了。
我們可以通過重設上面三個值,來使得操作系統上運行的所有啟用了Keepalive選項的TCP的socket的行為更改。
我們也可以只針對我們自己創建的socket,重設這三個值。它們分別對應TCP_KEEPIDLE、TCP_KEEPINTL和TCP_KEEPCNT的選項值,同樣可以使用setsockopt進行設置。
[cpp]
- #include <stdlib.h>
- #include <fcntl.h>
- #include <errno.h>
- #include <sys/socket.h>
- #include <netinet/tcp.h>
- #include <netinet/in.h>
- #include <netdb.h>
- #include <arpa/inet.h>
- int
- socket_set_keepalive (int fd)
- {
- int ret, error, flag, alive, idle, cnt, intv;
- /* Set: use keepalive on fd */
- alive = 1;
- if (setsockopt
- (fd, SOL_SOCKET, SO_KEEPALIVE, &alive,
- sizeof alive) != 0)
- {
- log_warn ("Set keepalive error: %s.\n", strerror (errno));
- return -1;
- }
- /* 10秒鐘無數據,觸發保活機制,發送保活包 */
- idle = 10;
- if (setsockopt (fd, SOL_TCP, TCP_KEEPIDLE, &idle, sizeof idle) != 0)
- {
- log_warn ("Set keepalive idle error: %s.\n", strerror (errno));
- return -1;
- }
- /* 如果沒有收到回應,則5秒鐘後重發保活包 */
- intv = 5;
- if (setsockopt (fd, SOL_TCP, TCP_KEEPINTVL, &intv, sizeof intv) != 0)
- {
- log_warn ("Set keepalive intv error: %s.\n", strerror (errno));
- return -1;
- }
- /* 連續3次沒收到保活包,視為連接失效 */
- cnt = 3;
- if (setsockopt (fd, SOL_TCP, TCP_KEEPCNT, &cnt, sizeof cnt) != 0)
- {
- log_warn ("Set keepalive cnt error: %s.\n", strerror (errno));
- return -1;
- }
- return 0;
- }
而WIN32環境下的參數設置,就要麻煩一些,需要使用另外的一個函數WSAIoctl和一個結構struct tcp_keepalive。
它們的原型分別為:
[cpp]
- #include <winsock2.h>
- #include <mstcpip.h>
- int WSAIoctl(
- SOCKET s,
- DWORD dwIoControlCode,
- LPVOID lpvInBuffer,
- DWORD cbInBuffer,
- LPVOID lpvOutBuffer,
- DWORD cbOutBuffer,
- LPDWORD lpcbBytesReturned,
- LPWSAOVERLAPPED lpOverlapped,
- LPWSAOVERLAPPED_COMPLETION lpCompletionRoutine
- );
- struct tcp_keepalive {
- u_long onoff;
- u_long keepalivetime;
- u_long keepaliveinterval;
- };
在這裡,使用WSAIoctl的時候,dwIoControlCode要使用SIO_KEEPALIVE_VALS,lpvOutBuffer用不上,cbOutBuffer必須設置為0。
struct tcp_keepalive結構的參數意義為:
onoff,是否開啟KEEPALIVE; keepalivetime,多長時間觸發Keepalive報文的發送; keepaliveinterval,多長時間沒有回應觸發下一次發送。
注意:這裡兩個時間單位都是毫秒而不是秒。
[cpp]
- #include <winsock2.h>
- #include <mstcpip.h>
- int
- socket_set_keepalive (int fd)
- {
- struct tcp_keepalive kavars[1] = {
- 1,
- 10 * 1000, /* 10 seconds */
- 5 * 1000 /* 5 seconds */
- };
- /* Set: use keepalive on fd */
- alive = 1;
- if (setsockopt
- (fd, SOL_SOCKET, SO_KEEPALIVE, (const char *) &alive,
- sizeof alive) != 0)
- {
- log_warn ("Set keep alive error: %s.\n", strerror (errno));
- return -1;
- }
- if (WSAIoctl
- (fd, SIO_KEEPALIVE_VALS, kavars, sizeof kavars, NULL, sizeof (int), &ret, NULL,
- NULL) != 0)
- {
- log_warn ("Set keep alive error: %s.\n", strerror (WSAGetLastError ()));
- return -1;
- }
- return 0;
- }