tr 轉換,壓縮,截短,刪除字符
tr [option].....set1 [set2]
參數:
-d,--delete
刪除字符串1中的字符,不進行轉換。
-s,--squeeze-repeats
將重復出現字符串壓縮為一個字符串。
-t,--truncate-set1
將字符串1的長度截成字符串2的長度。
-c,--complement
取字符串1的補集。要求字符集為ASCII。
--help 打印幫助。
--version 顯示版主信息。
轉義字符如下:
\NNN 字符的八進制碼
\\ 反斜線
\a BELL響鈴
\b 空格
\c 不打印新行符
\n 新行
\r 回車
\t 橫向跳格
\v 堅向跳格
字符模式:
CHAR1-CHAR2 表示從字符CHAR1到CHAR2.如a-z,A-Z...
[CHAR*] 表示一個或連續幾個CHAR。
[CHAR*REPEAT] 表示REPEAT個數個CHAR。
[:alnum:] 表示所有字母和數字。
[:alpha:] 表示所有字母。
[:blank:] 表示橫向空格。
[:cntrl:] 表示控制字符。
[:digit:] 表示所有數字。
[:graph:] 表示可打印字符,不包括空格。
[:lower:] 表示小寫字母。
[:upper:] 表示大寫字母。
[:print:] 表示可打印字符,包括空格。
[:xdigit:] 表示十六進制數字。
[=CHAR=] 表示CHAR
例子:
(1)去除oops.txt裡面的重復的小寫字符
復制代碼代碼如下:
tr -s "[a-z]"<oops.txt >result.txt
(2)刪除空行
復制代碼代碼如下:
tr -s "[\012]" < plan.txt 或 tr -s ["\n"] < plan.txt
(3)有時需要刪除文件中的^M,並代之以換行
復制代碼代碼如下:
tr -s "[\015]" "[\n]" < file 或 tr -s "[\r]" "[\n]" < file
(4)大寫到小寫
復制代碼代碼如下:
cat a.txt |tr "[a-z]" "[A-Z]" >b.txt
(5)刪除指定字符
一個星期的日程表。任務是從其中刪除所有數字,只保留日期。日期有大寫,也有小寫格式。因此需指定兩個字符范圍[a-z]和[A-Z],命令tr -cs "[a-z][A-Z]" "[\012*]" 將文件每行所有不包含在[a-z]或[A-Z](所有希臘字母)的字符串放在字符串1中並轉換為一新行。-s選項表明壓縮所有新行, -c表明保留所有字母不動。原文件如下,後跟tr命令:
復制代碼代碼如下:
tr -cs "[a-z][A-Z]" "[\012*]" <diary.txt
(6)轉換控制字符
tr的第一個功能就是轉換控制字符,特別是從dos向UNIX下載文件時,忘記設置ftp關於回車換行轉換的選項時更是如此。cat -v filename 顯示控制字符。
復制代碼代碼如下:
cat -v stat.txt
box aa^^^^^12^M
apple bbas^^^^23^M
^Z
猜想『^ ^ ^ ^ ^ ^』是tab鍵。每一行以Ctrl-M結尾,文件結尾Ctrl-Z,以下是改動方法。
使用-s選項,查看ASCII表。^的八進制代碼是136,^M是015,tab鍵是011,^Z是032 ,下面將按步驟完成最終功能。
用tab鍵替換^ ^ ^ ^ ^ ^,命令為"\136" "[\011*]"。將結果重定向到臨時工作文件stat.tmp
復制代碼代碼如下:
tr -s "[\136]" "[\011*]" <stat.txt >stat.tmp
用新行替換每行末尾的^M,並用\n去除^Z,輸入要來自於臨時工作文件stat.tmp。
復制代碼代碼如下:
tr -s "[\015][\032]" "\n" <stat.tmp
要刪除所有的tab鍵,代之以空格,使用命令
復制代碼代碼如下:
tr -s "[\011]" "[\040*]" <input.file
(7)替換passwd文件中所有冒號,代之以tab鍵,可以增加可讀性
復制代碼代碼如下:
tr -s "[:]" "[\011]" < /etc/passwd 或 tr -s "[:]" "[\t]" < /etc/passwd
(8)使路徑具有可讀性
如果用 echo $PATH 或者 echo $LD_LIBRARY_PATH 等類似的命令來顯示路徑信息的話,我們看到的將會是一大堆用冒號連接在一起的路徑, tr命令可以把這些冒號轉換為回車,這樣,這些路徑就具有很好的可讀性了
復制代碼代碼如下:echo $PATH | tr ":" "\n"
(9)可以在vi內使用所有這些命令!只要記住:在tr命令前要加上您希望處理的行范圍和感歎號 (!),如 1,$!tr -d '\t'(美元符號表示最後一行)。