在進行文本文件進行處理時,對文件件中的行、單詞、字符進行迭代和遍歷是非常常用的操作。而將一個簡單的循環用於迭代,再加上來自stdin或文件的重定向,這就是對文件中的行、單詞、和字符進行迭代的基本方法。
廢話不多說,馬上來看看怎麼樣實現吧。
1、迭代文中的每一行
使用while循環從標准輸入中讀取,因為要在標准輸入中讀取,就要對文件進行重定向,使它重定向到stdin中,代碼如下:
while read line; do echo $line; done < file.txt
代碼的第一行從stdin中讀取一行,而stdin的來源為file.txt,因為最後一行用數據流重定向,把file.txt的內容重定向到了stdin。
2、迭代一行中的每一個單詞
我們可以用for循環來迭代一行中的單詞,代碼如下:
read line; for word in $line; do echo $word; done
代碼的第一行,從stdin中讀取一行,然後用for循環迭代一行中的所有單詞,並輸出,真是非常簡單實用。
3、迭代一個單詞中的每一個字符
從單詞中迭代每一個字符,可以說是這三種迭代中最困難的一種,因為從單詞中提取字符需要一定的技巧,其方法如下:
利用for循環對變量i進行迭代,迭代范圍從0到字符的長度-1。那如何取出單詞中的字符呢?我們可以借助一個特殊的表達式來取出單詞中的第i個字母,${string:start_position:count_of_characters},它的意思是,返回字符串string中,從第start_position起的count_of_characters個字符組成的字串,對於迭代一個單詞中的第一個字符,當然是從string的第i個字符起,返回長度為1的子串,這就是子串提取技術。所以代碼如下:
for((i=0; i<${#word}; ++i)) do echo ${word:i:1}; done
注:${#word}返回變量word的值的長度,即單詞的長度。