您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> Linux技術

Linux 刪除文本中的重復行的方法

在進行文本處理的時候，我們經常遇到要刪除重復行的情況。那怎麼解決呢？
下面就是三種常見方法？

第一，用sort+uniq，注意，單純uniq是不行的。

shell> sort -k2n file | uniq

這裡我做了個簡單的測試，當file中的重復行不再一起的時候，uniq將服務刪除所有的重復行。經過排序後，所有相同的行都在相鄰，因此unqi可以正常刪除重復行。

第二，用sort+awk命令，注意，單純awk同樣不行，原因同上。

shell> sort -k2n file | awk '{if ($0!=line) print;line=$0}'

當然，自己把管道後面的代碼重新設計一下，可能不需要sort命令先排序拉。

第三，用sort+sed命令，同樣需要sort命令先排序。

shell> sort -k2n file | sed '$!N; /^.∗\n\1$/!P; D'

最後附一個必須先用sort排序的文本的例子，當然，這個需要用sort排序的原因是很簡單，就是後面算法設計的時候的“局部性”，相同的行可能分散出現在不同的區域，一旦有新的相同行出現，那麼前面的已經出現的記錄就被覆蓋了，看了這個例子就好理解拉。
　　
ffffffffffffffffff
ffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
fffffffffffffffffff
eeeeeeeeeeeeeeeeeeee
eeeeeeeeeeeeeeeeeeee
gggggggggggggggggggg

其實，這是我隨便打進去的幾行字，沒想到就是必須用sort的很好例子，大家可以自己試試看。

上一篇文章： Linux中Wi-Fi無線網絡和AP無線熱點的配置教程
下一篇文章： Linux刪除重復行的代碼

Linux技術

Linux下刪除文本、文件中的空行

linux中的文本處理方法集錦

Linux中的LVM之增加容量與刪除卷的方法詳解

linux下刪除亂碼文件名的方法

Linux中的LVM之增加容量與刪除卷的方法詳解

Linux 第七天: (08月05日) Linux文本處理