由於經常學習Unix系統的一些知識,在工作中也很喜歡總結關於Unix操作系統相關的經驗教訓,下面就Unix系統問題來詳細說說吧。從2007年5月初開始,主線Unix系統頻頻出現問題,具體表現為中控室的三台監控顯示器逐漸反應緩慢,直至完全無反應,死機,最後變為黑屏,無法顯示.重啟Unix系統,復位,均不能正常運行,必須將硬盤重新裝系統才能恢復正常。
但是,恢復正常後,過一段時間(時間長短不確定,對於現存的兩個硬盤情況也不盡相同,有個(以前一直在用的)時間稍為長一點)故障就會繼續發生。周期一般為一個星期左右。
發生這種問題後,曾經和有關人員討論過,開始懷疑是硬盤的問題,因為硬盤使用的時間已經很長了,而且他們以前也曾懷疑過硬盤存在問題。試過借用五車間的硬盤拿過來試用,但是不能夠安裝Unix系統。
後來,李宗健買回來四個新硬盤,拿到車間試用。全部試過,有三個裝了系統(即BOS磁帶)以後,不能繼續安裝其它的磁帶(ROOT,USER1,USER2和APROL磁帶),其中有一個甚至不能進行格式化。硬盤的疑問暫時不能解決,於是開始尋求其它方面的嘗試。硬件方面,准備試用新的數據線,但是由於備用的那條數據線較短,沒有實行。
硬件方面暫時無法入手後,於是嘗試在軟件方面入手。由於是經常是到一定時間就出現死機,懷疑是原先的安裝程序有問題,或者是在安裝的過程中忽略了某個步驟。請五線的電氣管理員張添喜過來幫忙安裝(在試用新硬盤時也曾經請他過來幫忙安裝過,但也不成功)。
他安裝的步驟和資料上的一樣,所以結果也和我們安裝的一樣,沒有成功。我們於是對我們自己的安裝磁帶的質量產生了懷疑,設想用五線的系統磁帶安裝公司到我們的系統上。由於所用的Unix系統是一樣的,但安裝的軟件不一樣,所以只拿了他們的那個Unix系統磁帶過來安裝。不幸的是,結果還是跟我們以前的一樣,用的時間一般都不超過一個星期。
重新懷疑是硬件的問題,打算拿我們的硬盤到五線去試,利用他們的硬件條件,用我們自己的磁帶安裝。在實施這個計劃之前,我們再對電腦的硬件系統做一次全面的檢查。最後,我們發現,電源的兩個小風扇不轉了。
我們暫時得出一個結論,就是冷卻的不足導致溫度的升高,使硬盤工作於過高的環境溫度,導致某些電子元件失常,丟失數據,最後死機。於是,我們將有兩個小風扇備件電源裝上去,並且重新裝過系統試用。
經過一個多星期的時間都沒有再出現過系統問題。這樣一來,就可以肯定是電源的原因了。一直到現在,過了一個多月都沒有出現過問題,除了Unix系統的時間自動改變(這個問題從“千年蟲”問題以來一直都出現過)。這個問題可能要尋求解決,和車間商量過,有機會的話將時間調到滯後8個小時(Unix系統改變時間一般都是超前8小時)。
後來,將拆下來的電源作檢查,發現當電源不帶負載時輸出12V能夠滿壓輸出,但當接上風扇時,12V的輸出電壓馬上降低幾伏。而硬盤的額定工作電壓為12V,由此可以估計出硬盤經常死機的主要原因:就是電壓的不足導致硬盤工作不穩定,最後出現丟失數據,甚至死機。至此,電腦主線系統頻繁出問題得到了暫時解決。
為了防止此類故障再次發生,可以采取以下的方法措施:
1,檢查電源的電壓輸出是否達到額定值。周期大約為每3個月一次,最好是在停機狀態下進行。
2,控制電櫃內的溫度,特別要注意背包空調的開啟情況,保證Unix系統在合適的溫度下運行。