歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Unix知識 >> 關於Unix

AIX系統的日常監控維護


  UNIX操作系統在各電信運營商中應用非常廣泛,各種業務管理系統的後台服務器幾乎都采用UNIX操作系統。AIX作為UNIX操作系統中的一種,因其穩定性高、兼容性好的特點受到眾多系統管理員的歡迎。
  下面提供幾個方法,供大家共享,旨在提高維護的目的性、針對性及維護效率,降低故障發生率,從日常維護管理上做到“有的放矢”,“萬無一失”。
  1、 使用df –k命令檢查文件系統是否滿
  用root用戶登陸AIX後,在命令提示符“#”後輸入:df –k.,表示以k為單位檢查文件系統的使用率。如果占用率(%Iused)超過90%,則需要進行空間調整。
  2、 使用errpt |more命令查看系統出錯日志
  在命令提示符“#”後輸入:errpt |more,表示以分頁的形式顯示系統出錯日志(包括硬件與軟件的出錯信息)。根據顯示的信息判斷系統硬件及軟件的運行情況。輸入:errclear 0命令,清除現有的系統日志。
  3、使用last命令檢查系統登陸情況
  在命令提示符“#”後輸入:last,顯示各個login用戶(如:root等)登陸的信息。如果發現有異常的登陸用戶或者登陸IP,則進行相應安全性的檢查及處理。
  4、 使用find / -name core –print命令檢查是否有巨大的core文件生成
  在命令提示符“#”後輸入:find / -name core –print,表示從系統根目錄開始查找所有名為core的文件(巨大的core文件容易造成系統崩潰)。如果存在,一般直接刪除即可。
  5、 使用vmstat命令檢查CPU及內存運行情況
  在命令提示符“#”後輸入:vmstat 5,表示每隔5秒鐘顯示系統CPU及內存運行情況。查看kthr(kernel運行隊列中處於等待狀態的進程數)字段的r(運行隊列中的進程數)項的顯示值,如果該數值是系統實際CPU數的4倍或4倍以上,則表示CPU占用率過高,需要考慮提高系統CPU工作頻率;查看memory(虛擬和真實內存的使用信息)字段的fre(空閒頁面的數量)項,如果數值低於120,則說明系統內存短缺。有時候數值雖然高於120,也可以根據實際情況調整內存;查看page(頁面活動的信息)字段的pi(從頁面輸入的頁)、po(輸出到頁面的頁)、fr(空閒的頁面數)及sr(通過頁面置換算法搜索到的頁面數)項的值,這4個值一般都為0,有時候也有可能為1;最後查看cpu(cpu的使用率)字段的us(用戶進程的時間)及sy(系統進程的時間)項的值,兩項值的和應該不超過90%,否則說明CPU能力短缺。
  6、 使用lsps –a命令檢查交換內存空間使用情況
  在命令提示符“#”後輸入:lsps -a,查詢交換內存空間使用情況。如果%used字段低於70%,則系統運行正常。
  7、 使用mail –u root命令檢查系統發送給root用戶的mail錯誤報告
  在命令提示符“#”後輸入:mail –u root,顯示系統發送給root用戶的mail錯誤報告。查看是否有硬件或軟件方面的錯誤信息報告,並做相應處理。
  8、 使用diag命令檢查系統硬件運行情況
  每個月用diag命令檢查一下系統硬件的運行情況,及時發現硬件可能出現的故障。
  綜上所述,作為AIX系統管理員,在日常維護工作中要做好預測工作,對系統進行及時監控,將可能發生的系統故障扼殺在萌芽階段。
Copyright © Linux教程網 All Rights Reserved