歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Unix知識 >> Unix資訊

Unix系統被塞滿的清理策略

在我們對Unix系統的學習中,我們有很多要學的知識。盡管現在的磁盤容量越來越大,但它終究有被塞滿的可能,如果遇上粗枝大葉的系統管理員,磁盤被塞滿的時間將變得更短。

一個Unix系統/linux運行環境,一旦遇到某個分區(也稱文件系統)被塞滿,後果也許會十分糟糕—我曾有過在凌晨2點起來干活的經歷—分區/tmp滿了,導致某個守護進程不能寫入磁盤而異常終止。想必其他人也有類似的情況,怎樣處理和避免這樣的麻煩呢?這裡有些意見供大家參考。

先談非技術方面的因素,簡單的講就是規章制度。Linux/Unix系統大多是公共服務器,應該禁止上傳與工作無關的私人數據。某君買了一個NAS(網絡附屬存儲)設備,4個73G的硬盤,本來打算做web的後台數據存儲,但是,但是….後來據我所知,這個大容量磁盤不到2個月所剩空間不到20G,私下浏覽,嘿!大部分數據是他私人的,他本來就有收藏廢品的嗜好,難怪呢。因此在這個方面,制度應該嚴厲一些,避免同事放垃圾數據在公共空間。

磁盤上的數據可能隨時增長,任何人不可能24小時盯著它,因此實現自動化監控手段是十分必要的,對於更大規模的網絡環境,這也許是唯一的途徑。下面是一個用perl寫的監控磁盤容量的腳本(大宇對此有貢獻):
 

  1. #!/usr/bin/perl -w  
  2. # this program will check disk capacity $full and send the warning message  
  3. # to $email_address  
  4. # (set the threshold to 90 and check it in the daytime so no paging  
  5. # is needed)  
  6. my $email_address = '[email protected]';  
  7. my $hostname = `/sbin/ifconfig -a|grep inet|head -1|cut -f2 -d":"|cut -f1 -d" "`;  
  8. my $dmesg = `dmesg`;  
  9. chomp(my $now = `date +"%x %X"`);  
  10. my $full = 90; # the threshold to send the warning  
  11. my $warn = 95;  
  12. my $count = 0;  
  13. my ($dev,$total,$used);  
  14. my @df_messages = `df|grep -v proc`;  
  15. print @df_messages;  
  16. shift(@df_messages);  
  17. foreach $message (@df_messages) {  
  18. chomp($message);  
  19. ($dev, $total, $used, $available, $capacity, $mount) = split(/\s+/, $message);  
  20. $capacity =~ s/(\d+)\%/$1/;  
  21. if ($capacity > $full) {  
  22. $available[$count] = $available;  
  23. $capacity[$count] = $capacity;  
  24. $mount[$count] = $mount;  
  25. ++$count;  
  26. $email_address = '[email protected]' if ($capacity > $warn);  
  27. }  
  28. }  
  29. if ($count > 0) {  
  30. open(MAIL, "|/usr/sbin/sendmail -t");  
  31. print MAIL "To: $email_address \n";  
  32. print MAIL "Subject: Disk almost full on $hostname ($now)\n";  
  33. print MAIL "\n";  
  34. for ($i = 0; $i < $count; ++$i) {  
  35. print MAIL "There are only $available[$i] KB ($capacity[$i]\% full) left on $mount[$i] \n";  
  36. }  
  37. }  
  38. if ( $dmesg =~ m/ERROR/ )  
  39. {  
  40. open(EMAIL, "|/usr/sbin/sendmail -t") or die "Can't fork for sendmail: $!\n";  
  41. print EMAIL <<_EOF_ ;  
  42. To: $email_address  
  43. subject: HARDWARE error on $hostname!!!  
  44. $hostname needs to be checked right now!  
  45. .  
  46. _EOF_  
  47. close("EMAIL");  

把這個腳本放在定時任務crontab裡即可實現自動監控,只要某個分區的容量達到腳本中閥值,系統就會發送報警郵件到管理員信箱,更進一步還可設定發送手機短信報警。

知道某個分區快要被塞滿的情況後,接下來的事情就是清理它了。登陸Unix系統,然後使用命令df –h察看具體的磁盤使用情況(老一點版本的solaris不支持選項-h,請用-k這個選項),

磁盤的利用率是以百分比的方式顯示的,非常直觀。找到快要被塞滿的分區之後,應該先著手查找占用空間大的最大的文件,然後處理這個占用空間最大的文件。這裡我用一個實例(根分區/root)來演示這個過程。

1、進入目錄/root,執行命令 du –h | sort –n 就把當前目錄下目錄以及文件所占的大小按順序排列出來了,一屏顯示不完的話再用加一個管道 du –h | sort –n | more 就好了。
 

  1. -bash-3.00# du -h | sort -n| more  
  2. 1K   ./.dt/appmanager  
  3. 1K   ./.dt/help  
  4. 1K   ./.dt/icons  
  5. 1K   ./.dt/tmp  
  6. ……….(省略若干行)  
  7. 914K   ./mysql-5.0.37/zlib  
  8. 933K   ./mysql-5.0.37/ndb/src/kernel/blocks/dblqh  
  9. 938K   ./mysql-5.0.37/scripts  
  10. 945M   .           //這個東西占太大的空間  
  11. 957K   ./mysql-5.0.37/extra/yassl/taocrypt  
  12. 959K   ./vsftpd-2.0.5  
  13. 1002K   ./mysql-5.0.37/ndb/src/common  
  14. -bash-3.00# 

有上面的輸出,我們可以知道在當前目錄裡有大文件,但是看不出是哪個文件。

2、再執行命令 ls –al | grep ^- |more 就可以看見每個文件的大小。
 

  1. -bash-3.00#       ls -al | grep ^-|more  
  2. -rw-------   1 root   root       810 Apr 29 09:59 .ICEauthority  
  3. -rw-------   1 root   root       98 Apr 29 09:59 .Xauthority  
  4. -rw-------   1 root   root       730 Apr 30 07:52 .bash_history  
  5. -rwxr-xr-x   1 root   root     5111 Apr 29 08:30 .dtprofile  
  6. -rw-r--r--   1 root   root       81 Apr 29 08:30 .gtkrc-1.2-gnome2  
  7. -rw-------   1 root   root       0 Apr 29 08:30 .recently-used  
  8. -rw-r--r--   1 root   root   681090961 Feb 28 12:29 10202_database_solx  
  9. 86.zip  
  10. ……….(省略若干)  
  11. -rw-r--r--   1 root   root   3069440 Apr 29 11:31 tar-1.16-sol10-x86-lo  
  12. cal  
  13. -rw-r--r--   1 root   root   10895360 Oct 22 2006 tar-1.16.tar  
  14. -rw-r--r--   1 root   root     155985 Jul 3 2006 vsftpd-2.0.5.tar.gz  
  15. -bash-3.00# 

最大文件的信息,它的文件名是10202_database_solx86.zip,再用命令du –h 10202_database_solx86.zip可直接顯示它的大小為650M。
 

  1. -bash-3.00#   du -h 10202_database_solx86.zip  
  2. 650M   10202_database_solx86.zip 

3、移走或刪除占用空間的大文件。

大家看一看,找大文件是不是很簡單?!當然如果使用awk這樣的工具寫shell腳本更是方便的法門,還有一個方法是用find加選項 –size,請大家自己去試驗。這樣,我們對Unix系統的文件系統被塞滿的清理策略就講解到這裡了。

Copyright © Linux教程網 All Rights Reserved