正則表達式就是處理字符串的方法,它以行為單位來進行字符串的處理行為,正則表達式通過一些特殊符號的輔助,可以讓用戶輕易達到查找、刪除、替換某特定字符串的處理程序。
正則表達式基本上就是一種“表示法”,只要工具程序支持這種表示法,那麼該工具程序就可以利用正則表達式處理字符串。例如vi,grep,awk,sed等。
正則表達式和之前的bash通配符是兩個完全不同的東西,兩者毫無關系,這個要注意下。
# grep [-A] [-B] [--color=auto] ‘string’ filename
-A:後面加數字,為after的意思,除了列出該行,後續的n行也列出
-B:before的意思,不解釋
# dmesg | grep -n -A3 -B2 –color=auto ‘eth’ <== 內核信息
====幾個基本的正則式特殊符號====
特殊符號 代表意義 [:alnum:] 代表英文大小寫字符以及數字,亦即 0-9, A-Z, a-z [:alpha:] 代表任何英文大小寫字符,亦即 A-Z, a-z [:blank:] 代表空白鍵與 [Tab] 按鍵兩者 [:cntrl:] 代表鍵盤上面的控制按鍵,亦即包括 CR, LF, Tab, Del.. 等等 [:digit:] 代表數字而已,亦即 0-9 [:graph:] 除了空白字元 (空白鍵與 [Tab] 按鍵) 外的其他所有按鍵 [:lower:] 代表小寫字元,亦即 a-z [:print:] 代表任何可以被列印出來的字元 [:punct:] 代表標點符號 (punctuation symbol),亦即:” ‘ ? ! ; : # $… [:upper:] 代表大寫字元,亦即 A-Z [:space:] 任何會產生空白的字元,包括空白鍵, [Tab], CR 等等 [:xdigit:] 代表 16 進制的數字類型,因此包括: 0-9, A-F, a-f 的數字與字符====基礎正則式====
RE 字符 意義與范例 ^word 意義:待搜尋的字串(word)在行首!word$ 意義:待搜尋的字串(word)在行尾!grep -n ‘^#’ regular_express.txt
. 意義:代表『一定有一個任意字元』的字符!grep -n ‘!$’ regular_express.txt
\ 意義:跳脫字符,將特殊字符的特殊意義去除!grep -n ‘e.e’ regular_express.txt
* 意義:重復零個到無窮個的前一個字符grep -n \’ regular_express.txt
[list] 意義:字元集合的 RE 字符,裡面列出想要擷取的字元!grep -n ‘ess*’ regular_express.txt
[n1-n2] 意義:字元集合裡,列出想要撷取的字元范圍!grep -n ‘g[ld]‘ regular_express.txt
[^list] 意義:字元集合的 RE 字符,裡面列出不要的字串或范圍!grep -n ‘[A-Z]‘ regular_express.txt
\{n,m\} 意義:連續 n 到 m 個的『前一個 RE 字符』grep -n ‘oo[^t]‘ regular_express.txt
grep -n ‘go\{2,3\}g’ regular_express.txt
====分析工具sed====
sed本身是一個管道命令,可以分析stdin數據
# sed [-nefr] [動作]
-n:使用安靜模式(silent),在一般模式下,所有來自stdin數據都顯示出來,而-n後只顯示被sed特殊處理的那一行
-e:直接在命令行模式上進行sed的動作編輯
-f:直接將sed動作寫在一個文件內,-f filename 則可以執行filename內的sed動作
-r:sed的動作支持的是擴展型正則式語法(默認是基礎型)
-i:直接修改讀取的文件內容,而不是由屏幕輸出
動作說明:[n1[,n2]] function
n1,n2:不見得存在,一般代表選擇進行動作的行數,比如在10到20行間進行,則”10,20 [動作行為]‘
function的參數:
a:新增,a的後面可以接字符串,而這些字符串會在新的一行出現(目前的下一行)
c:替換,c的後面接字符串,這些字符串可以替換n1,n2之間的行
d:刪除,後面不接任何參數
i:插入,i後面可接字符串,這些字符串會在新的一行出現(目前的上一行)
p:打印,也就是將某個選擇的數據打印出來。通常p會與參數sed -n 一起運行
s:替換,就是直接進行替換工作,通常這個s的動作可以搭配正則式例如:1,29s/old/new/g就是
注:sed後面接的動作,需要用兩個單引號”括住。
# nl /etc/passwd | sed ’2,5d’
# nl /etc/passwd | sed ’3,$d’
整行替換:
# nl /etc/passwd | sed ’2,5c No 2-5 number’
# nl /etc/passwd | sed -n ’5,7p’ 這個等價於 : head -n 7 | tail -n 5
sed的查找並替換,跟vim的很類似:
# sed ‘s/要被替換的字符串/新的字符串/g’
# nl /etc/passwd | sed ‘/^$/d’ <==刪除空白行
====擴展正則式====
====好用的數據處理工具awk====
相比於sed常常作用於一整行的處理,awk則運用於將一行分成數個字段來處理,適用於處理小型數據
# awk ‘條件類型1 {動作1} 條件類型2 {動作2} …’ filename
# awk -n 5 | awk ‘{print $t “\t” $3}’
awk處理流程:
1,讀入第一行,並將第一行的數據填入$0,$1,$2等變量中
2,依據條件類型限制,判斷是否需要進行後面的動作
3,做完所有的動作與條件類型
4,若還有後續的行的數據,則重復上面的1~3的步驟,直到所有的數據都讀完為止
awk的內置變量為:
* NF :每一行($0)擁有的字段總數
* NR :目前awk所處理的是第幾行數據
* FS :目前的分隔符,默認是空格鍵
# last -n 5 | awk ‘{print $1 “\t lines: ” NR “\t columns: ” NF}’
# cat /etc/passwd | awk ‘BEGIN {FS=”:”} $3 < 10 {print $1 “\t ” $3}’
====文件的比較命令diff====
# diff [-bBi] original_file new_file
-b:忽略一行中僅有多個空白的區別
-B:忽略空白行的區別
-i:忽略大小寫的不同
====補丁命令patch====
先用diff命令生成補丁文件:
# diff -Naur passwd.old passwd.new > paswd.patch
# patch -pN < patch_file <==更新
# patch -R -pN < patch_file <== 還原
-p:後面的N表示取消基層目錄的意思
-R:代表還原,將新的文件還原成原本的舊的版本
再開始把舊文件升級到新版本:
# patch -p0 < passwd.patch
把新版本還原:
# patch -R -p0 < passwd.patch
打印命令pr….
============END===============