現在各家銀行的儲蓄、信用卡等計算機業務處理系統均運行Unix操作系統平台。電子化的發展拓展了銀行的業務領域,提高了工作效率,加強了業務的准確性、保密性、安全性,樹立了銀行的社會形象,產生間接的經濟效益。電子化銀行的發展對計算機數據的可靠性提出了更高的要求。
據筆者調查,在Unix操作系統上備份和恢復數據的控制程序決大多數是用tar命令實現的。tar命令具有使用簡單好學易用的特點。但筆者在使用tar命令的過程中,發現tar命令對於中國用戶具有一個嚴重的隱患:對文件名為漢字且較長的文件能夠歸檔打包,但不能解開該檔案包。
例如:
1先創立一個長漢字文件名文件:
# cat /etc/passwd 長長長長長長長長長長長長長長長長長長
2將該文件歸檔至abc文件包:
3解開或查看abc檔案包:
# tar xvf abc 或atr tvf abc
abc檔案包將不能解開或查看。
一、 剖析
Unix操作系統的tar命令產生的歸檔文件稱tar格式檔案文件,具有以下格式:
1每個文件被加上了一個512字節的文件屬性頭,然後以512字節為單位塊在包中連續存放,占有整數個塊。最後一個塊不能寫滿,其後用0x00填寫。
2如文件長度為零字節或是鏈接文件,則只有512字節的文件屬性頭。
3用1024字節的0x00作為檔案文件尾。
4文件屬性頭結構:
- char dummy [512];512字節文件屬性頭
- char name[100]; 100字節以內文件名
- char mode [8]; 八進制文件權限
- char uid[8]; 八進制文件主人號
- char gid[8]; 八進制文件組號
- char size[12]; 八進制文件長度
- char mtime[12]; 八進制文件修改時間
- char chksum[8]; 八進制屬性頭校驗和
- char 1inkf1ag; 文件連接狀態
- char 1inkname[100]; 連接文件名
- char extno[4]; 連續卷分卷號
- char extota1[4]; 分卷個數
- char efsize[12]; 八進制續分卷文件長度
- char compid; 文件壓縮狀態
Unix操作系統文件屬性頭結構中字節校驗和chksum是頭結構除chksum部分的字節和加八進制數400加文件壓縮狀態值後轉換為八進制得到的。文件壓縮狀態為‘1'時表示文件內容處於壓縮狀態,在解包時,tar命令將自動調用compress把文件內容解壓縮,而不改變文件名。
筆者在分析一個含有長漢字文件名的tar檔案文件時發現:長漢字文件名的屬性頭中chksum值是錯誤的。經分析發現造成這種錯誤的原因是:一個漢字的字節和是負整數,長漢字文件名的屬性頭的字節和有可能為負整數,Unix操作系統tar命令源程序由於為西文而未能判斷屬性頭字節和為負的情況。
在創立檔案文件時,Unix操作系統tar命令用sprintf函數轉換屬性頭字節和為八進制輸出到chksum,這時破壞了chksum正常格式。在打開檔案文件時,tar命令用sscanf函數從屬性頭按八進制格式化讀取chksum時,不能得到正確數據,tar命令將中止展開檔案文件。
二、 解決方法
從上面分析我們得出以下結論:1要解決問題必須修改tar源程序,充分考慮漢化Unix操作系統產生的tar檔案包文件屬性頭中字節校驗和為負的情況。2編寫修補程序,將出錯的tar檔案文件屬性頭中字節校驗和chksum修復。
第一種方法需得到Unix操作系統公司源程序級的技術支持或由Unix操作系統公司技術人員解決,這也是筆者對Unix操作系統公司的建議,我們只能期待。
第二種方法筆者進行了有效的嘗試,並用c編寫了一個修補程序mtar.c,經編譯成mtar運行程序,本程序具有以下功能:
- Amtar -v tarfi1e 修補任何原因造成的tar檔案包中文件的chksum錯誤包括本程序的-c功能。
- Bmtar -t tarfi1e 查考tar檔案包中文件信息。
- C mtar -c tarfi1e 加密tar檔案包,使tar命令不能打開該包。
- D mtar -p tarfi1e 將包中的所有文件置壓縮狀態標志。
- E mtar -u tarfi1e 將包中所有文件置非壓縮狀態標志。
這樣,我們就對Unix操作系統的tar的問題進行了解析,並且提出了解決方法。希望能幫助大家解決tar的問題。