您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> Linux技術

管理員必備的Linux系統監控工具

#1: top - 進程活動
　　top提供一個當前運行系統實時動態的視圖，
　　也就是正在運行進程。在默認情況下，顯示系統
　　中CPU使用率最高的任務，並每5秒鐘刷新一次。
　　#2: vmstat -系統活動、硬件及系統信息
　　使用vmstat命令可以得到關於進程、內存、
　　內存分頁、堵塞IO、traps及CPU活動的信息。
　　#3: w - 顯示誰已登錄，他們正在做什麼？
　　w命令顯示系統當前用戶及其運行進程的信息。
　　#4：uptime - 告訴系統已經運行了多久？
　　uptime命令過去只顯示系統運行多久。現在，
　　可以顯示系統運行多久、當前有多少的用戶登錄、
　　在過去的1，5，15分鐘裡平均負載時多少。
　　#5：ps - 顯示進程
　　ps命令顯示當前運行進程的快照。使用-A或-
　　e 顯示所有進程。ps 與 top 非常相似，但ps 提
　　供更多的信息。
　　#6: free - 內存使用情況
　　free命令顯示系統中空閒的、已用的物理內存
　　及swap內存,及被內核使用的buffer。
　　#7: iostat - CPU平均負載，硬盤活動
　　iostat命令可報告中央處理器（CPU）的統計
　　信息，各種設備、分區及網絡文件系統輸入/輸出
　　的統計信息。
　　#8: sar - 搜集和報告系統活動
　　sar命令用來搜集、報告和儲存系統活動信息。
　　#9:mpstat - 多處理器使用率
　　mpstat命令可以顯示所有可用處理器的使用
　　情況，處理器編號從 0開始。mpstat -P ALL 顯
　　示每個處理器的平均使用率。
　　#10: pmap - 進程的內存使用
　　pmap命令可以顯示進程的內存映射，使用這
　　個命令可以找出造成內存瓶頸的原因。
　　#11：netstat - 網絡相關信息
　　netstat 可以顯示網絡鏈接、路由表信息、接
　　口統計信息、偽裝鏈接和多播成員(multicast
　　memberships)
　　#12：ss - 網絡相關信息
　　ss命令用來顯示網絡套接字信息，它允許顯示
　　類似netstat一樣的信息。
　　#13: iptraf - 網絡實時信息
　　iptraf是一個可交互式的IP網絡監控工具。它
　　可以生成多種網絡統計信息包括：TCP 信息、
　　UDP數量、ICMP和OSPF信息、以太網負載信
　　息、節點狀態、IP校驗錯誤等。
　　#14：tcpdump：詳細的網絡流量分析
　　tcpdump 是一個簡單網絡流量轉儲工具，然
　　而要使用好需要對TCP/IP協議非常熟悉。
　　#15:strace - 系統調用
　　追蹤系統調用和型號，這對於調試 Web服務
　　器和其他服務器非常有用。了解怎樣追蹤進程和
　　他功能。
　　#16：/proc文件系統 - 各種內核信息
　　/proc目錄下文件提供了很多不同硬件設備和
　　內核的詳細信息。
　　#17:Nagios - 服務器及網絡監控
　　Nagios 是一款非常流行的系統及網絡監控軟
　　件。你可以輕松監控所有的主機、網絡設備及服
　　務。它能在發生故障和重新恢復後發送警訊。
　　#18:Cacti - 基於Web的監控工具
　　Cacti是一套完成的網絡圖形化解決方案，基
　　於RRDTool的資料存儲和圖形化功能。Cacti提
　　供一個快速的輪詢器、進階的圖形化模板、多種
　　數據采集方法和用戶管理功能。這些功能都擁有
　　非常友好易用的界面，確保可以部署在一個包含
　　數百台設備的復雜網絡中。它提供關於網絡
　　CPU、內存、已登錄用戶、Apache、DNS等信
　　息。
　　#19:KDE System Guard
　　KSysguard 是在 KDE 桌面下一個網絡化的系
　　統監控工具。這個工具可以通過SSH會話運行。
　　它提供很多功能，例如可以監控本機和遠程主機
　　的客戶端/服務器架構，前端圖形界面使用所謂傳
　　感器得到信息並展現出來。傳感器返回的可以是
　　一個簡單的數值或是一組表格的信息。針對不同
　　的信息類型，提供一個或多個顯示。這些顯示被
　　組織多個工作表中，可以工作表可以獨體儲存和
　　加載。所以，KSysguard不只是一個簡單的任務
　　管理器，還是一個可以控制多台服務器的強大工
　　具。
　　#20:Gnome System Monitor
　　System Monitor可以顯示系統基本信息、監
　　控系統進程、系統資源及文件系統使用率。你也
　　可以使用System Monitor監控和修改系統行為。
　　盡管沒有KDE System Guard功能強大，但其提
　　供的基本信息對於入門用戶還是非常有用的。
　　Linux常用監控命令簡介 - top
　　指令介紹
　　-b : 批次模式運行。
　　-c : 顯示執行任務的命令行。
　　-d : 設定延遲時間
　　-h : 幫助
　　-H : 顯示線程。將顯示所有進程產生的線程。
　　-i : 顯示空閒的進程。
　　-n : 執行次數。一般與-b搭配使用
　　-u : 監控指定用戶相關進程
　　-U : 監控指定用戶相關進程
　　-p : 監控指定的進程。
　　-s : 安全模式操作
　　-S : 累計時間模式
　　-v : 顯示top版本，然後退出。
　　-M : 自動顯示內存單位（k/M/G）
　　top作為日常管理工作中最常用也是最重要的
　　Linux 系統監控工具之一，可以動態觀察系統進
　　程狀況。top命令顯示的項目很多，默認值是每
　　5秒更新一次，按q鍵可以退出。顯示的各項目
　　為：
　　輸出數值解讀為：
　　15:06:57 up 129 days, 19:03, 5 users, load average: 1.21, 1.20, 1.25
　　uptime 該項顯示的是系統啟動時間、已經運行的時間和三個平均負載值（最近1秒，5秒，15秒的
　　負載值）。
　　222 processes: 219 sleeping, 2 running, 1 zombie, 0 stopped
　　processes 自最近一次刷新以來的運行進程總數。這些進程被分為正在運行的，休眠的，停止的。
　　CPU states: cpu user nice system irq softirq iowait idle
　　 total 0.9% 0.0% 27.4% 0.0% 0.0% 0.2% 71.2%
　　 cpu00 1.9% 0.0% 19.4% 0.0% 0.0% 0.0% 78.6%
　　 cpu01 0.0% 0.0% 33.0% 0.0% 0.0% 0.0% 66.9%
　　 cpu02 1.9% 0.0% 22.3% 0.0% 0.0% 0.9% 74.7%
　　 cpu03 0.0% 0.0% 35.2% 0.0% 0.0% 0.0% 64.7%
　　CPU states 顯示用戶模式，系統模式，優先級進程（只有優先級為負的列入考慮）和閒置等各種
　　情況所占用CPU時間的百分比。優先級進程所消耗的時間也被列入到用戶和系統的時間中，所以總
　　的百分比將大於100％。
　　Mem: 16214336k av, 15682832k used, 531504k free, 0k shrd, 215016k buff
　　 10896844k actv, 3379680k in_d, 446432k in_c
　　Mem 內存使用情況統計，其中包括總的可用內存，空閒內存，已用內存，共享內存和緩存所占內存
　　的情況。
　　Swap: 10482404k av, 0k used, 10482404k free 14856500k cached
　　Swap 交換空間統計，其中包括總的交換空間，可用交換空間，已用交換空間。
　　PID USER PRI NI SIZE rss SHARE STAT %CPU %MEM TIME CPU COMMAND
　　27869 root 25 0 460M 460M 455M R 25.0 2.9 12559m 1 vmware-vmx
　　31819 root 16 0 6016 6016 5048 S 1.6 0.0 17573m 2 magicdev
　　27837 root 15 -10 460M 460M 455M S < 0.7 2.9 1328m 0 vmware-vmx
　　27868 root 15 -10 460M 460M 455M S < 0.3 2.9 644:35 3 vmware-vmx
　　PID 每個進程的ID。PPID 每個進程的父進程ID。UID 每個進程所有者的UID 。
　　USER 每個進程所有者的用戶名。
　　PRI 每個進程的優先級別。
　　NI 該進程的優先級值。
　　SIZE 該進程的代碼大小加上數據大小再加上堆棧空間大小的總數。單位是KB。
　　TSIZE 該進程的代碼大小。對於內核進程這是一個很奇怪的值。
　　DSIZE 數據和堆棧的大小。
　　TRS 文本駐留大小。
　　D 被標記為“不干淨”的頁項目。
　　LIB 使用的庫頁的大小。對於ELF進程沒有作用。
　　RES 該進程占用的物理內存的總數量，單位是KB。
　　SHARE 該進程使用共享內存的數量。
　　STAT 該進程的狀態。S=休眠；D=不可中斷的休眠；R=運行；Z=僵死；T=停止或跟蹤。
　　TIME 該進程自啟動以來所占用的總CPU時間。如果進入的是累計模式，那麼該時間還包括這個進程
　　子進程所占用的時間。且標題會變成CTIME。
　　％CPU 該進程自最近一次刷新以來所占用的CPU時間和總時間的百分比。
　　％MEM 該進程占用的物理內存占總內存的百分比。
　　COMMAND 該進程的命令名稱，如果一行顯示不下，則會進行截取。內存中的進程會有一個完整的命
　　令行。
　　：Linux常用監控命令簡介 – vmstat，ps等
　　vmstat [-a] [-n] [delay [ count]]
　　vmstat [-f] [-s] [-m]
　　vmstat [-S unit]
　　vmstat [-d]
　　vmstat [-p disk partition]
　　vmstat [-V]
　　指令介紹
　　-a：顯示活躍和非活躍內存
　　-f：顯示從系統啟動至今的fork數量。
　　-m：顯示slabinfo
　　-n：只在開始時顯示一次各字段名稱。
　　-s：顯示內存相關統計信息及多種系統活動數。
　　delay：刷新時間間隔。如果不指定，只顯示
　　一條結果。
　　count：刷新次數。如果不指定刷新次數，但
　　指定了刷新時間間隔，這時刷新次數為無窮。
　　-d：顯示磁盤相關統計信息。
　　-p：顯示指定磁盤分區統計信息
　　-S：使用指定單位顯示。參數有 k , K, m, M,
　　分別代表 1000, 1024, 1000000, 1048576
　　字節。默認單位為K（1024 bytes）
　　-V：顯示vmstat版本信息。
　　方便用法推薦
　　每2秒輸出一條結果
　　vmstat 2
　　顯示活躍和非活躍內存
　　vmstat -a 2
　　輸出數值解讀
　　(Procs)r: 運行隊列中進程數量
　　(Procs)b: 等待IO的進程數量
　　(Memory)swpd: 使用虛擬內存大小
　　(Memory)free: 可用內存大小
　　(Memory)buff: 用作緩沖的內存大小
　　(Memory)cache: 用作緩存的內存大小
　　(Swap)si: 每秒從交換區寫到內存的大小
　　(Swap)so: 每秒寫入交換區的內存大小
　　(IO)bi: 每秒讀取的塊數
　　(IO)bo: 每秒寫入的塊數
　　(System)in: 每秒中斷數，包括時鐘中斷。
　　(System)cs: 每秒上下文切換數。
　　(CPU)us: 用戶進程執行時間(user time)
　　(CPU)sy: 系統進程執行時間(system time)
　　(CPU)id: 空閒時間(包括IO等待時間)
　　(CPU)wa: 等待IO時間
　　ps 命令
　　ps [options]
　　指令介紹
　　-e 顯示所有進程。
　　-f 全格式。
　　-h 不顯示標題。
　　-l 長格式。
　　-w 寬輸出。
　　a 顯示終端上的所有進程，包括其他用戶的
　　r 只顯示正在運行的進程。
　　x 顯示沒有控制終端的進程。
　　方便用法推薦
　　查看使用Vivek用戶名運行的進程
　　# ps -U vivek -u vivek u
　　只顯示Lighttpd的進程ID
　　# ps -C lighttpd -o pid=
　　找出消耗內存最多的前10名進程
　　# ps -auxf | sort -nr -k 4 | head -10
　　找出使用CPU最多的前10名進程
　　# ps -auxf | sort -nr -k 3 | head -10
　　free 命令
　　free [-b|-k|-m][-o][-s delay][-t][-V]
　　指令介紹
　　-b 以Byte為單位顯示內存使用情況。
　　-k 以KB為單位顯示內存使用情況。
　　-m 以MB為單位顯示內存使用情況。
　　-o 不顯示緩沖區調節列。
　　-s<間隔秒數> 持續觀察內存使用狀況。
　　-t 顯示內存總和列。
　　-V 顯示版本信息。
　　輸出數值解讀
　　total used free shared buffers cached
　　Mem: 3266180 3250004 16176 0 110652
　　2668236
　　-/+ buffers/cache: 471116 2795064
　　Swap: 2048276 80160 1968116
　　total:總計物理內存的大小。
　　used:已使用多大。
　　free:可用有多少。
　　Shared:多個進程共享的內存總額。
　　Buffers/cached:磁盤緩存的大小。
　　used:已使用多大。
　　free:可用有多少。
　　uptime 命令
　　uptime
　　uptime [-V]
　　輸出數值解讀
　　18:02:41 up 41 days, 23:42, 1 user,
　　load average: 0.00, 0.00, 0.00
　　10:19:04：系統當前時間
　　up 257 days, 18:56：主機已運行時間,時間越
　　大，說明你的機器越穩定。
　　12 user：用戶連接數，是總連接數而不是用戶
　　數
　　load average：系統平均負載，統計最近1, 5,
　　15分鐘的系統平均負載
　　如果每個CPU內核的當前活動進程數不大於3的
　　話，那麼系統的性能是良好的。如果每個CPU內
　　核的任務數大於5，那麼這台機器的性能有嚴重
　　問題。
標簽: linux

上一篇文章： Linux下的幾個配置文件以及啟動先後順序(轉)
下一篇文章： centos7部署LAMP+xcache（module模式）

Linux技術

20個Linux系統管理員必知系統監控工具

linux系統監控工具

Linux系統監控工具

Linux 管理員手冊(1)--Linux系統概述

Linux系統監控工具——Nagios

linux系統監控工具——Conky

80 多個 Linux 系統管理員必備的監控工具

Linux系統管理員必備工具系列之vmstat