在linux中分割大文件,比如一個5gb日志文件,需要把它分成多個小文件,分割後以利於普通的文本編輯器讀取。
有時,需要傳輸20gb的大文件到另一台服務器,也需要把它分割成多個文件,這樣便於傳輸數據。
以下通過五個不同的例子,來講解Linux下分割大文件的方法,供大家參考。
例1、以每個文件1000行分割
split命令分割文件成每個文件1000行,並且文件名依次為 [前綴]aa, [前綴]ab, [前綴]ac等,默認的前綴是X,每個文件的行數為1000行。
命令:
復制代碼代碼如下:
$ split mylog -l 1000
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae
例2、以每個文件20MB分割
分割文件為多個20MB的文件,附帶-b選項。
命令:
復制代碼代碼如下:
$ split -b 20M logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
例3、以每個文件50MB指定前綴分割
使用–bytes選項把文件分割成多個50MB的文件,–bytes類似-b選項,在第二個參數指定前綴。
命令:
復制代碼代碼如下:
$ split --bytes=50M logdata mydatafile
$ ls -lh
total 204M
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
例4、基於行數分割文件
使用-l選項指定行數來把文件分割成多個行數相同的文件。
命令:
復制代碼代碼如下:
$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile
例5、以數字後綴命名分割文件
使用-d選項可以指定後綴為數字,如00,01,02..,而不是aa,ab,ac。
命令:
復制代碼代碼如下:
$ split -d testfile
$ ls
testfile x00 x01 x02
可用選項
復制代碼代碼如下:
短選項 長選項 選項描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數。
-d –numeric-suffixes 使用數字作為後綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數大小。</p>
<p>短選項 長選項 選項描述
-b –bytes=SIZE SIZE 值為每一輸出檔案的大小,單位為 byte。
-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數。
-d –numeric-suffixes 使用數字作為後綴。
-l –lines=NUMBER NUMBER 值為每一輸出檔的列數大小。