自動殺死Unix僵死的進程
# autokill
ps -ef | awk &apos{ print $1,$2,$7,$8 }&apos | \
awk &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos | \
awk &apos!/root/ { print "kill -9 " $2}&apos > /tmp/k_kill
chmod 777 /tmp/k_kill
/tmp/k_kill
現在對Autokill程序加以解釋。
首先,用Unix 命令 ps -ef 查看進程狀態,通過管道傳送給 AWK 進行處理。
在第一個 AWK 中,獲取進程的用戶標識(UID)、進程號(PID)、進程占用CPU時間(Time)、進程執行命令(CMD)四個字段的值。
在第二個AWK 中,通過模式匹配,選取所有匹配模式的行。在AWK 中,[0-9]匹配0~9中任一個數字,[1-9]匹配1~9中任何一個數字,連用兩個[0-9][0-9]則匹配一個任意兩位數,因此[0-9][0-9]:[0-9][0-9]:[1-9][0-9]則匹配 Time 時間字段值,查找占用 CPU 時間超過 10 秒的進程,如果要查找占用 CPU 時間超過半小時的進程,則把模式改成 [0-9][0-9]:[3-9][0-9]:[0-9][0-9]。
在第三個 AWK 中,用 "!/root/ "過濾掉由 root用戶生成的進程,並進行Shell語言拼裝,將最終結果定向到文件 /tmp/k_kill。在 /tmp/k_kill 文件中,都是形如 kill -9123 的Shell命令。
在Autokill程序的最後,執行 /tmp/k_kill 殺死進程。
Autokill程序采用了管道處理方式,如要查看中間結果,則可以依次斷開管道。
第一步執行:
ps -ef
第二步執行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos
第三步執行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos | \
AWK &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos
第四步執行:
ps -ef | AWK &apos{ print $1,$2,$7,$8 }&apos | \
AWK &apos/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }&apos | \
AWK &apos!/root/ { print "kill -9 " $2}&apos > /tmp/k_kill
最終查看 /tmp/k_kill 文件。
再有,如只想自動殺死由某一用戶執行的進程(如jdc3206),只要將模式"!/root/"改成 "/jdc3206/"即可;如只想殺死執行某一命令的進程(如 xinmu ),只要將模式"!/root/" 改成"/xinmu/"即可。
最後用 crontab -e 增加一個 cron 作業。
0,30 /tmp/autokill
經過以上步驟,系統每隔半小時執行一次/tmp/autokill。但在Unix系統中,有些僵死的進程會莫名其妙地不能用 kill 命令殺死,這就需要重新引導機器,一方面清除系統垃圾,另一方面需要對資源重新分配。