你曾經是否想要把一個大文件分割成多個小文件?比如一個5gb日志文件,我們需要把它分成多個小文件,這樣我們才有可能使用普通的文本編輯器讀取它。有時我們需要傳輸20gb的大文件到另一台服務器,這就需要我們把它分割成多個文件,這樣便於傳輸數據。下面我們來講解使用split命令來切割文件的方法。
復制代碼代碼如下:
[root@localhost database]# ls -lh gkdb.db
-r--r--r-- 1 root root 411M Jul 23 17:20 gkdb.db
將將這個276M文件分割成20M的小文件,文件分割操作如下:
復制代碼代碼如下:
[root@localhost database]# split -b 20m gkdb.db gkdb_pack_
split 是命今。
-B 20M 是指將每個分卷文件最大20M 。
gkdb.db 需要分割的文件。
gkdb_pack_ 是指分割後的文件開頭, 分割後後的文件名一般為 gkdb_pack_aa、gkdb_pack_ab、gkdb_pack_ac依次類推。
顯示分割後的文件名及大小
復制代碼代碼如下:
[root@localhost database]# ll -lh gkdb_pack_a*
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aa
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ab
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ac
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ad
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ae
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_af
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ag
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ah
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ai
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aj
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ak
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_al
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_am
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_an
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ao
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ap
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_aq
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ar
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_as
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_at
-rw-r--r-- 1 root root 11M Jul 27 16:10 gkdb_pack_au
最下面的那個文件是剩余的文件。 20*20+11=411MB
合並文件
復制代碼代碼如下:
[root@localhost database]# cat gkdb_pack_*>gkdb.tar.gz
組裝前和組裝後的MD5值都是一樣的,不信的話可以使用md5sum命令來檢測一下。
如果要分割的是一個文本文件,比如有好幾千行,當然每行的字符數是不等的,想要以行數為分割,比如每100行生成1個文件,只需要 -l 參數,如下:
復制代碼代碼如下:
[root@pps public_rw]# split -l 100 test.txt
其實,如果不加任何參數,默認情況下是以1000行大小來分割的。
實例1、以每個文件1000行分割
split命令分割文件成每個文件1000行,並且文件名依次為 [前綴]aa, [前綴]ab, [前綴]ac等,默認的前綴是X,每個文件的行數為1000行,命令如下:
復制代碼代碼如下:
$ split mylog
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae
實例2、以每個文件20MB分割
分割文件為多個20MB的文件,附帶-b選項命令如下:
復制代碼代碼如下:
$ split -b 20M logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
實例3、以每個文件50MB指定前綴分割
使用–bytes選項把文件分割成多個50MB的文件,–bytes類似-b選項,在第二個參數指定前綴。
復制代碼代碼如下:
$ split --bytes=50M logdata mydatafile
$ ls -lh
total 204M
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
實例4、基於行數分割文件
使用-l選項指定行數來把文件分割成多個行數相同的文件。
復制代碼代碼如下:
$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile
實例5、以數字後綴命名分割文件
使用-d選項可以指定後綴為數字,如00,01,02..,而不是aa,ab,ac。
復制代碼代碼如下:
$ split -d testfile
$ ls
testfile x00 x01 x02