管理員必備的Linux系統監控工具
#1: top - 進程活動
top提供一個當前運行系統實時動態的視圖,
也就是正在運行進程。在默認情況下,顯示系統
中CPU使用率最高的任務,並每5秒鐘刷新一次。
#2: vmstat -系統活動、硬件及系統信息
使用vmstat命令可以得到關於進程、內存、
內存分頁、堵塞IO、traps及CPU活動的信息。
#3: w - 顯示誰已登錄,他們正在做什麼?
w命令顯示系統當前用戶及其運行進程的信息。
#4:uptime - 告訴系統已經運行了多久?
uptime命令過去只顯示系統運行多久。現在,
可以顯示系統運行多久、當前有多少的用戶登錄、
在過去的1,5,15分鐘裡平均負載時多少。
#5:ps - 顯示進程
ps命令顯示當前運行進程的快照。使用-A或-
e 顯示所有進程。ps 與 top 非常相似,但ps 提
供更多的信息。
#6: free - 內存使用情況
free命令顯示系統中空閒的、已用的物理內存
及swap內存,及被內核使用的buffer。
#7: iostat - CPU平均負載,硬盤活動
iostat命令可報告中央處理器(CPU)的統計
信息,各種設備、分區及網絡文件系統輸入/輸出
的統計信息。
#8: sar - 搜集和報告系統活動
sar命令用來搜集、報告和儲存系統活動信息。
#9:mpstat - 多處理器使用率
mpstat命令可以顯示所有可用處理器的使用
情況,處理器編號從 0開始。mpstat -P ALL 顯
示每個處理器的平均使用率。
#10: pmap - 進程的內存使用
pmap命令可以顯示進程的內存映射,使用這
個命令可以找出造成內存瓶頸的原因。
#11:netstat - 網絡相關信息
netstat 可以顯示網絡鏈接、路由表信息、接
口統計信息、偽裝鏈接和多播成員(multicast
memberships)
#12:ss - 網絡相關信息
ss命令用來顯示網絡套接字信息,它允許顯示
類似netstat一樣的信息。
#13: iptraf - 網絡實時信息
iptraf是一個可交互式的IP網絡監控工具。它
可以生成多種網絡統計信息包括:TCP 信息、
UDP數量、ICMP和OSPF信息、以太網負載信
息、節點狀態、IP校驗錯誤等。
#14:tcpdump:詳細的網絡流量分析
tcpdump 是一個簡單網絡流量轉儲工具,然
而要使用好需要對TCP/IP協議非常熟悉。
#15:strace - 系統調用
追蹤系統調用和型號,這對於調試 Web服務
器和其他服務器非常有用。了解怎樣追蹤進程和
他功能。
#16:/proc文件系統 - 各種內核信息
/proc目錄下文件提供了很多不同硬件設備和
內核的詳細信息。
#17:Nagios - 服務器及網絡監控
Nagios 是一款非常流行的系統及網絡監控軟
件。你可以輕松監控所有的主機、網絡設備及服
務。它能在發生故障和重新恢復後發送警訊。
#18:Cacti - 基於Web的監控工具
Cacti是一套完成的網絡圖形化解決方案,基
於RRDTool的資料存儲和圖形化功能。Cacti提
供一個快速的輪詢器、進階的圖形化模板、多種
數據采集方法和用戶管理功能。這些功能都擁有
非常友好易用的界面,確保可以部署在一個包含
數百台設備的復雜網絡中。它提供關於網絡
CPU、內存、已登錄用戶、Apache、DNS等信
息。
#19:KDE System Guard
KSysguard 是在 KDE 桌面下一個網絡化的系
統監控工具。這個工具可以通過SSH會話運行。
它提供很多功能,例如可以監控本機和遠程主機
的客戶端/服務器架構,前端圖形界面使用所謂傳
感器得到信息並展現出來。傳感器返回的可以是
一個簡單的數值或是一組表格的信息。針對不同
的信息類型,提供一個或多個顯示。這些顯示被
組織多個工作表中,可以工作表可以獨體儲存和
加載。所以,KSysguard不只是一個簡單的任務
管理器,還是一個可以控制多台服務器的強大工
具。
#20:Gnome System Monitor
System Monitor可以顯示系統基本信息、監
控系統進程、系統資源及文件系統使用率。你也
可以使用System Monitor監控和修改系統行為。
盡管沒有KDE System Guard功能強大,但其提
供的基本信息對於入門用戶還是非常有用的。
Linux常用監控命令簡介 - top
指令介紹
-b : 批次模式運行。
-c : 顯示執行任務的命令行。
-d : 設定延遲時間
-h : 幫助
-H : 顯示線程。將顯示所有進程產生的線程。
-i : 顯示空閒的進程。
-n : 執行次數。一般與-b搭配使用
-u : 監控指定用戶相關進程
-U : 監控指定用戶相關進程
-p : 監控指定的進程。
-s : 安全模式操作
-S : 累計時間模式
-v : 顯示top版本,然後退出。
-M : 自動顯示內存單位(k/M/G)
top作為日常管理工作中最常用也是最重要的
Linux 系統監控工具之一,可以動態觀察系統進
程狀況。top命令顯示的項目很多,默認值是每
5秒更新一次,按q鍵可以退出。顯示的各項目
為:
輸出數值解讀 為:
15:06:57 up 129 days, 19:03, 5 users, load average: 1.21, 1.20, 1.25
uptime 該項顯示的是系統啟動時間、已經運行的時間和三個平均負載值(最近1秒,5秒,15秒的
負載值)。
222 processes: 219 sleeping, 2 running, 1 zombie, 0 stopped
processes 自最近一次刷新以來的運行進程總數。這些進程被分為正在運行的,休眠的,停止的。
CPU states: cpu user nice system irq softirq iowait idle
total 0.9% 0.0% 27.4% 0.0% 0.0% 0.2% 71.2%
cpu00 1.9% 0.0% 19.4% 0.0% 0.0% 0.0% 78.6%
cpu01 0.0% 0.0% 33.0% 0.0% 0.0% 0.0% 66.9%
cpu02 1.9% 0.0% 22.3% 0.0% 0.0% 0.9% 74.7%
cpu03 0.0% 0.0% 35.2% 0.0% 0.0% 0.0% 64.7%
CPU states 顯示用戶模式,系統模式,優先級進程(只有優先級為負的列入考慮)和閒置等各種
情況所占用CPU時間的百分比。優先級進程所消耗的時間也被列入到用戶和系統的時間中,所以總
的百分比將大於100%。
Mem: 16214336k av, 15682832k used, 531504k free, 0k shrd, 215016k buff
10896844k actv, 3379680k in_d, 446432k in_c
Mem 內存使用情況統計,其中包括總的可用內存,空閒內存,已用內存,共享內存和緩存所占內存
的情況。
Swap: 10482404k av, 0k used, 10482404k free 14856500k cached
Swap 交換空間統計,其中包括總的交換空間,可用交換空間,已用交換空間。
PID USER PRI NI SIZE rss SHARE STAT %CPU %MEM TIME CPU COMMAND
27869 root 25 0 460M 460M 455M R 25.0 2.9 12559m 1 vmware-vmx
31819 root 16 0 6016 6016 5048 S 1.6 0.0 17573m 2 magicdev
27837 root 15 -10 460M 460M 455M S < 0.7 2.9 1328m 0 vmware-vmx
27868 root 15 -10 460M 460M 455M S < 0.3 2.9 644:35 3 vmware-vmx
PID 每個進程的ID。PPID 每個進程的父進程ID。UID 每個進程所有者的UID 。
USER 每個進程所有者的用戶名。
PRI 每個進程的優先級別。
NI 該進程的優先級值。
SIZE 該進程的代碼大小加上數據大小再加上堆棧空間大小的總數。單位是KB。
TSIZE 該進程的代碼大小。對於內核進程這是一個很奇怪的值。
DSIZE 數據和堆棧的大小。
TRS 文本駐留大小。
D 被標記為“不干淨”的頁項目。
LIB 使用的庫頁的大小。對於ELF進程沒有作用。
RES 該進程占用的物理內存的總數量,單位是KB。
SHARE 該進程使用共享內存的數量。
STAT 該進程的狀態。S=休眠;D=不可中斷的休眠;R=運行;Z=僵死;T=停止或跟蹤。
TIME 該進程自啟動以來所占用的總CPU時間。如果進入的是累計模式,那麼該時間還包括這個進程
子進程所占用的時間。且標題會變成CTIME。
%CPU 該進程自最近一次刷新以來所占用的CPU時間和總時間的百分比。
%MEM 該進程占用的物理內存占總內存的百分比。
COMMAND 該進程的命令名稱,如果一行顯示不下,則會進行截取。內存中的進程會有一個完整的命
令行。
:Linux常用監控命令簡介 – vmstat,ps等
vmstat [-a] [-n] [delay [ count]]
vmstat [-f] [-s] [-m]
vmstat [-S unit]
vmstat [-d]
vmstat [-p disk partition]
vmstat [-V]
指令介紹
-a:顯示活躍和非活躍內存
-f:顯示從系統啟動至今的fork數量 。
-m:顯示slabinfo
-n:只在開始時顯示一次各字段名稱。
-s:顯示內存相關統計信息及多種系統活動數。
delay:刷新時間間隔。如果不指定,只顯示
一條結果。
count:刷新次數。如果不指定刷新次數,但
指定了刷新時間間隔,這時刷新次數為無窮。
-d:顯示磁盤相關統計信息。
-p:顯示指定磁盤分區統計信息
-S:使用指定單位顯示。參數有 k , K, m, M,
分別代表 1000, 1024, 1000000, 1048576
字節。默認單位為K(1024 bytes)
-V:顯示vmstat版本信息。
方便用法推薦
每2秒輸出一條結果
vmstat 2
顯示活躍和非活躍內存
vmstat -a 2
輸出數值解讀
(Procs)r: 運行隊列中進程數量
(Procs)b: 等待IO的進程數量
(Memory)swpd: 使用虛擬內存大小
(Memory)free: 可用內存大小
(Memory)buff: 用作緩沖的內存大小
(Memory)cache: 用作緩存的內存大小
(Swap)si: 每秒從交換區寫到內存的大小
(Swap)so: 每秒寫入交換區的內存大小
(IO)bi: 每秒讀取的塊數
(IO)bo: 每秒寫入的塊數
(System)in: 每秒中斷數,包括時鐘中斷。
(System)cs: 每秒上下文切換數。
(CPU)us: 用戶進程執行時間(user time)
(CPU)sy: 系統進程執行時間(system time)
(CPU)id: 空閒時間(包括IO等待時間)
(CPU)wa: 等待IO時間
ps 命令
ps [options]
指令介紹
-e 顯示所有進程。
-f 全格式。
-h 不顯示標題。
-l 長格式。
-w 寬輸出。
a 顯示終端上的所有進程,包括其他用戶的
r 只顯示正在運行的進程。
x 顯示沒有控制終端的進程。
方便用法推薦
查看使用Vivek用戶名運行的進程
# ps -U vivek -u vivek u
只顯示Lighttpd的進程ID
# ps -C lighttpd -o pid=
找出消耗內存最多的前10名進程
# ps -auxf | sort -nr -k 4 | head -10
找出使用CPU最多的前10名進程
# ps -auxf | sort -nr -k 3 | head -10
free 命令
free [-b|-k|-m][-o][-s delay][-t][-V]
指令介紹
-b 以Byte為單位顯示內存使用情況。
-k 以KB為單位顯示內存使用情況。
-m 以MB為單位顯示內存使用情況。
-o 不顯示緩沖區調節列。
-s<間隔秒數> 持續觀察內存使用狀況。
-t 顯示內存總和列。
-V 顯示版本信息。
輸出數值解讀
total used free shared buffers cached
Mem: 3266180 3250004 16176 0 110652
2668236
-/+ buffers/cache: 471116 2795064
Swap: 2048276 80160 1968116
total:總計物理內存的大小。
used:已使用多大。
free:可用有多少。
Shared:多個進程共享的內存總額。
Buffers/cached:磁盤緩存的大小。
used:已使用多大。
free:可用有多少。
uptime 命令
uptime
uptime [-V]
輸出數值解讀
18:02:41 up 41 days, 23:42, 1 user,
load average: 0.00, 0.00, 0.00
10:19:04:系統當前時間
up 257 days, 18:56:主機已運行時間,時間越
大,說明你的機器越穩定。
12 user:用戶連接數,是總連接數而不是用戶
數
load average:系統平均負載,統計最近1, 5,
15分鐘的系統平均負載
如果每個CPU內核的當前活動進程數不大於3的
話,那麼系統的性能是良好的。如果每個CPU內
核的任務數大於5,那麼這台機器的性能有嚴重
問題。
標簽: linux