作者:姚烨 何曉宇 楊幫青 紅雲 在《調諧Linux網絡性能之調試工具篇》和《調諧LINUX網絡性能之網絡配置文件詳解》兩篇文章中,我們介紹了route、netstat、tcpdump三種網絡調諧測試工具的使用方法及其可實現的功能和網絡配置文件的內容,本文我們將從實戰的角度介紹網絡性能調諧的方法。 下面,我們先來介紹網絡性能調諧的第一種方法:服務方式選擇。 服務方式選擇 網絡服務器由於要同時為多個客戶提供服務,就必須使用某種方式來支持這種多任務的服務方式。一般情況下可以有三種方式來選擇,多進程方式、多線程方式及異步方式。其中,多進程方式中服務器對一個客戶要使用一個進程來提供服務,由於在操作系統中,生成一個進程需要進程內存復制等額外的開銷,這樣在客戶較多時的性能就會降低。為了克服這種生成進程的額外開銷,可以使用多線程方式或異步方式。在多線程方式中,使用進程中的多個線程提供服務,由於線程的開銷較小,性能就會提高。事實上,不需要任何額外開銷的方式還是異步方式,它使用非阻塞的方式與每個客戶通信,服務器使用一個進程進行輪詢就行了。異步方式下,多個任務之間的調度是由服務器程序自身來完成的,而且一旦一個地方出現問題則整個服務器就會出現問題,不在討論的范圍內。增大系統線程的數量:限制線程的數量的因素很多,主要有進程數量的限制,內存大小的限制,mutex/semaphore/shm/ipc的限制;一般情況下先增大進程最大數,再擴充內存,在增大線程最大數,而增大線程最大數的方法很簡單,只需改變glibc中兩處即可:線程最大數和線程堆棧區的大小;線程最大數的增加是以進程的異步I/O性能下為代價;所以需要加以平衡。 絡配置文件中有用的內容 1. 對於數據庫而言,增大共享內存段和信號量的多少,對數據傳輸效率的提高起到很重要的作用; 方法:只需編輯文件linux/include/linux/sem.h和linux/include/asm-i386/shmparam.h即可。 2. 先增大進程最大數,再擴充內存,再增大線程最大數,而增大線程最大數的方法很簡單,只需改變glibc中兩處即可:線程最大數和線程堆棧區的大小; 3. 把"/etc/inittab"文件中的一行注釋掉可以禁止用Control-Alt-Delete關閉計算機。如果服務器不是放在一個安全的地方,這非常重要。 編輯inittab文件(vi /etc/inittab)把這一行: ca::ctrlaltdel:/sbin/shutdown -t3 -r now 改為: #ca::ctrlaltdel:/sbin/shutdown -t3 -r now 用下面的命令使改變生效: [root@deep]# /sbin/init q 4. /etc/host.conf 文件指定如何解析主機名。Linux通過解析器庫來獲得主機名對應的IP地址。下面是一個"/etc/host.conf"的示例: order bind,hosts :指定主機名查詢順序,這裡規定先使用DNS來解析域名,然後再查詢"/etc/hosts"文件(也可以相反)。 可以在該文件後加上以下兩句: multi on:指定的主機可以有多個地址,擁有多個IP地址的主機一般稱為多穴主機。 ospoof on:指不允許對該服務器進行IP地址欺騙,以提高服務器的安全性。IP欺騙是一種攻擊系統安全的手段,通過把IP地址偽裝成別的計算機,來取得其它計算機的信任。 可調諧的Linux內核網絡參數 ICMP相關內核配置參數 概述:通常我們使用icmp包來探測目的主機上的其它協議(如tcp和udp)是否可用。比如包含"destination unreachable"信息的icmp包就是最常見的icmp包。 (1) icmp_destunreach_rate:設置內容為"Destination Unreachable"icmp包的響應速率。設置值應為整數。 應用實例: 假設有A、B兩部主機,首先我們在主機A上執行以下ipchains語句: ipchains -A input -p icmp -j REJECT 這裡的REJECT和DENY不同,DENY會丟掉符合條件的包如同沒有接收到該包一樣,而REJECT會在丟掉該包的同時給請求主機發回一個"Destination Unreachable"的icmp。 然後在主機B上ping主機A,這時候我們會發現"Destination Unreachable"icmp包的響應速度是很及時的。接著我們在主機A上執行: echo "1000" > /proc/sys/net/ipv4/icmp_destunreach_rate 也即每10秒鐘響應一個"Destination Unreachable"的icmp包。 這時候再從主機B上ping主機A就會發現"Destination Unreachable"icmp包的響應速度已經明顯變慢,我很好奇的測試了一下,發現剛好是每10秒響應一次。 (2)icmp_echo_ignore_broadcasts:設置是否響應icmp echo請求廣播,設置值應為布爾值,0表示響應icmp echo請求廣播,1表示忽略。 注意:windows系統是不響應icmp echo請求廣播的。 應用實例: 在我的RedHat6.x和RedHat7上該值缺省為0,這樣當有個用戶ping我的服務器所在的網段的網絡地址時,所有的linux服務器就會響應,從而也能讓讓該用戶得到我的服務器的ip地址,可以執行 echo "1" > /proc/sys/net/ipv4/icmp_echo_ignore_broadcasts 來關閉該功能。從而防止icmp風暴,防止網絡阻塞。 (3)icmp_echoreply_rate:設置系統響應icmp echo請求的icmp包的響應速度,設置值為整數。 應用實例: 假設有A、B兩部主機,首先我們在主機B上ping主機A,可以看到響應很正常,然後在主機A上執行 echo "1000" > /proc/sys/net/ipv4/icmp_echoreply_rate 也即每10秒鐘響應一個icmp echo請求包。然後再ping主機A就可以看到響應速度已經變成10秒一次。 最好合理的調整該參數的值來防止icmp風暴。 (4)icmp_echo_ignore_all:設置系統是否忽略所有的icmp echo請求,如果設置了一個非0值,系統將忽略所有的icmp echo請求。其實這是icmp_echoreply_rate的一種極端情況。參數值為布爾值,1:表示忽略,0:表示響應。 (5)icmp_paramprob_rate:當系統接收到數據報的損壞的ip或tcp頭時,就會向源發出一個包含有該錯誤信息的icmp包。這個參數就是用來設置向源發送這種icmp包的速度。當然,在通常情況下ip或tcp頭出錯是很少見的。參數值為整數。 (6)icmp_timeexceed_rate:數據報在網絡上傳輸時,其生存時間(time to live)字段會不斷減少,當生存時間為0時,正在處理該數據報的路由器就會丟棄該數據報,同時給源主機發送一個"time to live exceeded"的icmp包。該參數就是用來設置這種icmp包的發送的速度。當然,這通常用於充當路由器的linux主機。 IP相關內核配置參數 linux內核網絡參數中關於ip的配置參數通常是用來定義或調整ip包的一些特定的參數,除此之外還定義了系統的一些網絡特性。 (1)ip_default_ttl:設置從本機發出的ip包的生存時間,參數值為整數,范圍為0~128,缺省值為64。在windows系統中,ip包的生存時間通常為128。如果你的系統經常得到"Time to live exceeded"的icmp回應,可以適當增大該參數的值,但是也不能過大,因為如果你的路由壞路的話,就會增加系統報錯的時間。 (2)ip_dynaddr:該參數通常用於使用撥號連接的情況,可以使系統能夠立即改變ip包的源地址為該ip地址,同時中斷原有的tcp對話而用新地址重新發出一個syn請求包,開始新的tcp對話。在使用ip欺騙時,該參數可以立即改變偽裝地址為新的ip地址。該參數的參數值可以是: 1:啟用該功能 2:使用冗余模式啟用該功能 0:禁止該功能 應用實例:在使用ipchains配置ip欺騙帶動局域網共享一個ppp連接上網時,有時會出現剛開時連接一個站點連不通,再次刷新又可以連接的情況,這時候就可以設置該參數的值為1,從而立即改變偽裝地址為新的ip地址,就可以解決這類問題。命令為: echo "1" > /proc/sys/net/ipv4/ip_dynaddr (3)ip_forward:可以通過該參數來啟用包轉發功能,從而使系統充當路由器。參數值為1時啟用ip轉發,為0時禁止ip轉發。注意,我們可以在單網卡或雙網卡的主機上實現ip轉發。 應用實例: 假設我們使用一部裝有雙網卡的linux主機充當防火牆,這時候我們就必須執行以下命令來打開ip轉發功能: echo "1" > /proc/sys/net/ipv4/ip_forward (4) ip_local_port_range:設置當本地系統向外發起tcp或udp連接請求時使用的端口范圍。設置值為兩個整數,缺省為"1024 4999"。 應用實例: echo "1450 6000" > /proc/sys/net/ipv4/ip_local_port_range tcp相關內核配置參數 通過tcp配置參數可以控制tcp會話過程中的各個方面。 (1) tcp_fin_timeout:在一個tcp會話過程中,在會話結束時,A首先向B發送一個fin包,在獲得B的ack確認包後,A就進入FIN WAIT2狀態等待B的fin包然後給B發ack確認包。這個參數就是用來設置A進入FIN WAIT2狀態等待對方fin包的超時時間。如果時間到了仍未收到對方的fin包就主動釋放該會話。參數值為整數,單位為秒,缺省為180秒。 (2) tcp_syn_retires:設置開始建立一個tcp會話時,重試發送syn連接請求包的次數。 參數值為小於255的整數,缺省值為10。假如你的連接速度很快,可以考慮降低該值來提高系統響應時間,即便對連接速度很慢的用戶,缺省