1. split切分文件
# split -d -l 100 allBaiduLemma.o allBaiduLemma.o
這樣會將文件allBaiduLemma.o按照每個文件100行來切分,切分後文件的格式為allBaiduLemma.o.00,allBaiduLemma.o.01....
2. 文件的合並
#cat allBaiduLemma.o.01 allBaiduLemma.o.02 allBaiduLemma.o.03 > allBaiduLemma.o.left
3. 查找匹配的字符串在文件的行的編號
# grep -n "被查找字符串" filename
4. 截取文件的前100行到另外一個文件
# head -100 > file
5. 統計文件的行數
#wc -l file
統計多個文件的行數
#wc -l file* (匹配file*表達式的所有文件)
6. war包可以通過unzip命令解壓
#unzip xxxx.war
7. 將一個格式化的文件的每行的第n部分提取出來放到一個單獨的文件,如下例子,test文件中,每行都是分為三部門,並以制表符\t分割,如下把每行的第三部門提取出來放到另一個文件id.txt中
#cat test | awk -F '\t' '{print $3}' > id.txt
8. 修改文件編碼的方法
方法1 : vim打開文件,輸入": set fileencoding=utf-8" 可以修改編碼,輸入":set fileencoding"可以查看編碼
方法2: #iconv -f gbk -t utf-8 temp.txt,可將編碼為gbk的文件temp.txt轉成utf-8編碼