歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux編程 >> SHELL編程

Linux Shell系列(3) 正則表達式

正則表達式

正則表達式主要是用來描述一個句法規則的模式。其實說的通俗一點,就是利用字符和元字符的組合,對一些符合既定句法的模式進行模糊匹配。它的主要功能是文本查詢和字符串操作。

正則表達式的基本元素包括普通字符和元字符,在Linux shell裡面,常用的正則表達式元字符集為:S={*  .  ^  $  []  \  \<\>  \{\}  \{n,\}  \{n,m\} },每一個元字符都有自己在正則表達式中的含義,下面來介紹一下:

“ * ”符號:表示匹配前面一個普通字符0次或多次。注意這裡是一個普通字符,即如果是JO*B的話,那麼*就匹配字符“O”任意次,而不是匹配“JO”串。

“ . ”符號:表示匹配任意一個字符。字符“ . "就表示一個字符,這個字符可以是任意字符。例如字符串 ...73 就表示前面3個字符為任意字符(包括空格),第4個和第5個字符分別是7和3。

“ ^ ”符號:表示匹配行首。例如:^cloud就表示匹配以cloud字符串開頭的所有行。與上面匹配一個字符不一樣,這裡匹配的是後面跟著的整個字符串。

” $ "符號:表示匹配行尾。例如:cloud$ 就表示匹配以cloud字符串結尾的所有行。結合上面的匹配行首,^$表示匹配空行。

“ [] "符號:表示匹配方括號裡面的字符集中的一個。例如:數字0-9中的任意一個數字都滿足[0-9]這個表達式。值得注意的是,當^放在[]裡面的時候,^就不再表示行首,而是表示取反。如:[^7-9]則表示非7-9中的任意一個數字才滿足這個表達式。

” \ “符號:是轉義字符。如果你寫的正則表達式裡面包括元字符,而你又想將它當做普通字符用的話,就要在前面加上轉義符號" \ "了。例如:\$就表示一個普通字符”$"。

“\<\>"符號:表示精確匹配<>內的字符,” \ “是用來轉義<>這兩個字符的。例如:\<the\>表示匹配包含”the“的行,由於精確匹配,所以,”them“,”theory“這些單詞所在的行並不會被匹配到。

”\{\}"符號:與" * "類似,表示匹配前面的一個字符任意多次。但是“\{\}”可以指定重復的次數,如\{3\}則表示重復前面的字符3次;\{3,\}表示重復前面的字符至少3次;\{3,5\}表示重復3到5次。例如:JO\{3\}B則表示重復字符O三次,即JOOOB;JO\{3,\}B則表示至少重復O三次,即JOOOB,JOOOOB等都符合;\{3,5\}則匹配JOOOB,JOOOOB,JOOOOOB這幾個字符串。

通配符

初學的時候對於正則表達式和通配符的理解很模糊,兩個都是可以進行模糊匹配的,到底什麼時候用才是正則表達式,什麼時候用是通配符呢?其實,我們登錄系統之後,系統的bash shell並不支持正則表達式的,也就是說,我們如果使用bash shell的某些命令時使用正則表達式,shell可能會認不出來,只有當我們使用類似grep,sed,awk等工具的時候才有效。所以,我們在使用bash shell的時候也想達到模糊匹配的目的的話,就要使用通配符了。

通配符是使用正則表達式的一些元字符來的,常用的元字符集:E={?  *  []  {}  ^ }。不過,這個通配符的元字符意義跟正則表達式裡面的不太一樣。例如:

“ * "字符不再表示匹配前面一個字符任意多次,而是表示任意位置的任意字符。例如:phi*ip,則可以匹配philip,phillip,philsaip等開始三個是phi和結尾兩位是ip的任意字符。例如ls -l *.awk表示匹配以.awk結尾的所有文件,*表示任意長度任意字符組合。

" ? ”字符才表示任意一個字符。同正則表達式元字符的" . "

" {} “字符不需要轉義。在{}表示的是表達式集合。如:ls -l {[a-h]*.awk,0?.pem}則表示列出所有以a-h字符開頭的.awk文件的和以0開頭,後面接一個任意字符的.pem文件

" ^ "字符也不是表示行首,而是代表取反。

正則表達式和通配的應用環境上有些不一樣,但是都能夠達到模糊匹配的效果。在後面介紹到的使用grep,sed和awk等工具對於文件的查找以及各種操作中,正則表達式的匹配作用更加明顯。

相關閱讀:

Linux Shell 簡介 http://www.linuxidc.com/Linux/2012-06/63048.htm 
Linux Shell系列(2) 登陸Linux Shell的幾種方法 http://www.linuxidc.com/Linux/2012-06/63049.htm

Copyright © Linux教程網 All Rights Reserved