歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux編程 >> Linux編程

正則表達式及PHP中的正則函數

perl 和 ereg

正則表達式 (regular expression), 常簡寫為 regex, 用於在字符串中進行比較復雜的匹配

perl 和 ereg

現有兩種類型的正則表達式 perl 和 POSIX, perl 類型 更規范,執行效率越高, POSIX 類型常用於 Unix

php 提供了兩套正則表達式函數庫

preg_ 系列以 perl 為基礎

ereg_ 系列以 POSIX 為基礎

preg_ 系列更常用,ereg_ 將要被淘汰

原子

基本字符

ASCII碼中,除了下面要介紹的字符之外的,所有字符。基本字符與下面要介紹的各種特殊字符與模式結合使用,就形成了所謂的正則表達式。

Linux正則表達式特性及BRE與ERE的區別 http://www.linuxidc.com/Linux/2014-03/99152.htm

grep使用簡明及正則表達式 http://www.linuxidc.com/Linux/2013-08/88534.htm

正則表達式的用法 http://www.linuxidc.com/Linux/2013-03/81897.htm

正則表達式之零寬斷言  http://www.linuxidc.com/Linux/2013-03/81897.htm

Linux中正則表達式與文件格式化處理命令(awk/grep/sed) http://www.linuxidc.com/Linux/2013-03/81018.htm

單元符號 ()

圓括號中的基本字符在匹配時被看做一個整體。

正則匹配 (abc) abc

該整體會保存在內存中,可作為整體獲取,例如 "/go(abc)g\\1le/" 可以匹配 goabcgabcle, \\1 對應了 abc。

這種方法可用於匹配不同格式的日期 "/2014(.*)06\1(13)/" 可匹配 2014/06/13 或 2014-06-13 , 但不可匹配 2014-06/13 。這裡 \\1(13) 如不加括號會被認為內存中的第 113 號。

也可以用模式修飾符 x 實現 "/2014(.*)06\1 13/x",

原子表 []

與單元符號相反,原子表用於匹配其中的中任意一個原子。

正則匹配 [abc] a 或 b 或 c

原子表中 x-y 匹配 x 到 y 范圍內的字符, 常見用法如下

正則匹配 [0-9] 所有數字 [a-z] 所有小寫字母 [A-z] 所有大寫字母 [a-zA-z] 所有字母

需要注意的是 ^ 符號在原子表中表示排除,而在元字符中表示開頭

正則匹配 [^abc] 除了abc外的字符 [^0-9] 所有 數字

轉義字符

轉義字符就是一些常用原子表表達式的簡寫

轉義字符匹配原子表表示 \d 所有數字 [0-9] \D 除所有數字外 [^0-9] \w 所有字母加數字加下劃線 [a-zA-Z0-9_] \W 除字母數字下劃線之外的字符 [^a-zA-Z0-9_] \s 匹配空白(Tab,空格,換頁,換行) [\f\v\t\r\n] \S 匹配非空白 [^\f\v\t\r\n]

元字符 metacharacter

字符匹配 . 匹配除換行符以外的任意字符 * 匹配前一個內容的0次或1次或多次 + 匹配前一個內容的1次或多次 ? 匹配0次或1次 | 邏輯符 “或” ^ 匹配字符串首部內容,加在原子前, 例如 ^abc $ 匹配字符串尾部部內容, 加在原子後, 例如 abc$ \b 通過邊界匹配單詞,邊界為空格或特殊符號, \bis\b 用於匹配 is 單詞 \B 通過邊界匹配單詞以外內容 {m} 匹配前一個內容的m次 {m} 匹配前一個內容的大於m次 {m,n} 匹配前一個內容的m到n次

更多詳情見請繼續閱讀下一頁的精彩內容: http://www.linuxidc.com/Linux/2014-06/103204p2.htm

Copyright © Linux教程網 All Rights Reserved