歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Unix知識 >> Unix基礎知識

殺死Unix操作系統不服管教的進程

  在《linux.chinaitlab.com/administer/780117.html" target=_blank>合理管理進程讓其成為Unix系統的守護神 》這篇文章中談到進程是Unix系統的是守護神。可是有時候這個守護神也會鬧別扭,會跟Unix操作系統作對。如明明任務已經執行完成了,但是卻沒有正常結束進程。又或者進程無緣無故占用了大量的系統資源,導致系統速度減慢,影響了其他作業的正常運行。對於這些不服管教的進程,系統工程師只能夠拿起手中的屠刀,實行“殺無赦”政策。
  在Unix系統中有多種手段可以殺死這些異常的進程。通常情況下,筆者建議是殺進程的工作要有序的進行,盡量采取一些對操作系統影響小的方法。
  第一階段:在本機上殺死進程。
  系統工程師可以直接在Unix系統的命令中斷采用相關的命令來殺死異常進程。如可以按鍵盤上的DEL鍵、Ctrl+D鍵、Break鍵等等殺死進程。系統工程師按下這些鍵的任何一個,都會向系統進程發送中斷信號。注意,通常情況下只有root用戶才能夠殺死其他擁護的進程或者系統進程;而其他用戶只能夠殺死自己的進程。如現在Unix系統中要部署一個Oracle數據庫服務器。為了管理方便,Unix系統工程師建立了一個Oracle用戶,用來進行數據庫系統的維護與管理。此時,Oracle這個用戶就會運行幾個進程,如tns等進程。正常情況下,Oracle用戶以及root用戶都可以殺死這個進程。但是如果這個系統中還有其他用戶,則無法殺死這個進程。
  另外如果用戶想殺的進程是shell的子進程,則還可以采用kill命令家進程的作業號的方式。如kill % 作業號等等。Shell是Unix系統中很好的一個交互工具,也有人把它叫做命令行界面,是Unix操作系統下最傳統、歷史最悠久的用戶和計算機的交互截面。系統管理員可以在這裡直接輸入相關的命令來執行各種各樣的維護任務,包括殺死異常進程等等。其實它跟微軟操作系統下的命令行界面很相似,不過也有一些差異的地方。如Unix操作系統下的shell既是用戶與系統交互的界面,也是控制系統的腳本語言。這就是兩者最大的差異。Shell做重要的特點就是隱藏了操作系統的底層細節,故對於工程師來說這是首選的維護系統的工具。
  其實大部分時候工程師都是在shell環境下管理進程,包括上篇文章中談到的查看進程信息、把後台進程調到前台等等。故在本機上殺死進程也大部分是在shel環境下進行。為此系統工程師用的更多的可能還是利用kill命令來殺死shell子進程。
  第二階段:從另一個終端來殺進程。
  有時候可能進程比較頑固,若從當前終端來殺它的話,還殺不掉。此時管理員就可以通過曲線救國的方式,從另一個終端登陸到Unix操作系統,然後采用kill命令來殺死異常進程。這個主要的步驟如下。
  第一步從另一個終端登陸操作系統。通常情況下,Unix系統支持多個終端。當系統工程師發現在當前終端無法殺死某個進程的話,則不用急於通過重新啟動或者強制關機等方式來殺死這些殺不掉的進程。這是下下之策。遇到這種情況,系統工程師可以從另外一個終端登陸到操作系統,然後嘗試使用kill命令來殺死進程。
  第二步使用ps –u命令來查找需要殺死進程所對應的進程號或者作業號。ps 命令將活動進程的當前狀態和有關的內核線程寫到標准輸出中。這個命令有很多參數,如-m、-l、s、u 和 v等等。注意當采用-m參數時則系統將使用額外的行顯示與進程相關的線程。不帶任何參數時,ps 命令將會顯示關於當前工作站的信息。而使用-o參數時,ps命令檢查內存或調頁區域並確定進程創建時的命令名和參數是什麼。如果 ps 命令不能找到該信息,存儲在內核中的命令名顯示在方括號中。如果想快速查找特定作業的進程信息,采用-u參數是不錯的選擇。如ps –u oracle 等等。
  第三步使用kill命令殺死異常進程,如kill 26014。Kill命令就會向目標進程發送一個信號以中斷這個進程。通常情況下,此時就可以殺死那些比較頑固的進程。如果在kill命令後面沒有加上進程號或者作業號,則系統會采用默認的信號值15,這是一個終止命令。如果此時還沒有殺死這個進程的話,那麼可以采用更強烈的方式,即kill -9 進程號。對於頑固進程來說,這條命令可能會更加有用。這主要是因為這個命令使進程在接收到中斷信號後,不能關閉它在使用的任何文件。正是因為有這個後遺症,故只有在采用上面那幾種手段無效的情況下,才推薦使用這個終極殺手。
  第三階段:通過父進程來殺死子進程。
  在unix操作系統中,進程有父子進程的關系。某個進程可能會創建另外一個進程,這個創建者就是父進程,而新建立的進程就是子進程。

  通常情況下,如果停止了一個父進程,則該父進程產生的所有子進程都將自動終止。但是,這個過程可能會破壞數據文件或者其他一些難以預料的結果。故正常情況下,筆者是建議系統工程師先關閉掉所有的子進程,然後再關閉父進程。
  但是,當采取了任何手段,包括kill -9手段之後仍然無法正常殺死頑固進程之後,系統工程師只好采用這個終極殺手,即通過關閉父進程來自動關閉不聽話的子進程。但是,正如上面所說的,這很可能會導致一些連鎖反映。所以在采用這種方式之前,系統工程師還是要預先估計一下可能會帶來的後果。如可以把這個父進程所產生的子進程能夠關閉的先關閉掉。然後再通過殺死父進程來自動終止子進程。這可以把對操作系統的不利影響降低到最低。
  第四階段:利用系統注銷功能來關閉殺不掉的進程。
  若通過關閉父進程仍然殺不死子進程的話,那麼管理員還可以通過注銷系統的方式來殺死進程。這就好象Windows系統注銷一樣,會關閉當前的所有進程與任務。不過有時候系統工程師可能不想關閉所有的進程,如一些關系到服務器運行的進程。此時,系統工程師在注銷系統之前,需要采取一定的手段,讓系統注銷後仍然能夠保持某些進程正常運轉。如果系統工程師想在系統注銷後仍然執行一個或者多個進程,則可以采用nohup命令。如此設置後,即使在系統注銷後,在後台執行的進程仍然可以繼續執行,不會終止。這個手段就可以把系統注銷對於用戶的不利影響降低到最低。如果Unix操作系統是企業中的一台服務器,而不是客戶端,那麼這個特性將會對企業很有利。
  nohup命令運行由Command參數和任何相關的Arg參數指定的命令,而忽略所有掛斷信號。為此在系統注銷後仍然可以使用nohup命令運行後台中的程序。注意無論是否將 nohup命令的輸出重定向到終端,輸出都將附加到當前目錄的nohup.out 文件中。如果當前目錄的nohup.out文件不可寫,則輸出重定向到$HOME/nohup.out 文件中。如果上面這些文件都不可以用的話,那麼Command參數指定的命令不可調用。故系統工程師如果事後要查看這些系統注銷後仍然運行在後台進程的結果,就可以依次查看以上這兩個文件。
  操作系統注銷後,通常再頑固的進程都會被殺死掉。不過有時候會因為進程實在難纏,注銷的過程時間可能會比較長。若操作系統在長時間後仍然無法注銷的話,那只有強制重新啟動電腦了。不過重新啟動後很可能會出現啟動故障。為此,重新啟動系統來終止進程是不得已而為止的做法了。

Copyright © Linux教程網 All Rights Reserved