徐帥 許海
摘要:該文主要介紹正則表達(dá)式的最基礎(chǔ)的快速入門,以便從未了解過正則表達(dá)式的人對它初步了解及簡單使用。關(guān)鍵詞:正則表達(dá)式;快速入門
中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)29-0269-02
該文主要涉及正則表達(dá)式的最基礎(chǔ)的快速入門。在讀完-本文后可能還是無法熟練有效的使用正則表達(dá)式,因為本文旨在讓從未了解過正則表達(dá)式的人初步了解以及簡單地使用它,在進(jìn)行深入的學(xué)習(xí)的時候輕松一些,想要熟練掌握正則表達(dá)式還需要你去更深入地去學(xué)習(xí)和使用它。
1正則表達(dá)式
正則表達(dá)式是描述一定匹配規(guī)則的特殊文本字符或字符串,用于判斷字符串格式或者提取字符串內(nèi)容。它最基本的模式,只是匹配文字。例如“\b[A ZO-9._%+-]+@[A-ZO-9.-]+\.[A-Z]{2,}\b”,這是一個較復(fù)雜的模式。它描述了一系列字母,數(shù)字,點,下劃線,百分號和連字符,后跟一個@符號,后跟另一系列字母,數(shù)字和連字符,最后是一個點和兩個或多個字母。如果仔細(xì)看就會發(fā)現(xiàn),此模式描述了一個電子郵件地址。使用上述正則表達(dá)式模式,您可以搜索文本文件以查找電子郵件地址,或驗證給定字符串是否與電子郵件地址相似。下面講的就是上述正則表達(dá)式所用到的一些知識。
2文字字符
最基本的正則表達(dá)式是由單個文字字符組成。例如“a”,它匹配字符串中首次出現(xiàn)的該字符;在字符串“Java”中,他就匹配“J”后面的那個“a”。
另外,還有一些特殊字符——“元字符”的存在。元字符在單獨使用時大多數(shù)是錯誤的,因為元字符在正則表達(dá)式中具有特殊含義,所以要將元字符用作正則表達(dá)式中的文字,則需要使用反斜杠“\”來轉(zhuǎn)義它們。例如要匹配“1+1=2”,則正確的表達(dá)式為“1\+1=2”,否則的話,加號具有特殊含義。請注意,省略反斜杠的1+1=2是有效的正則表達(dá)式。所以你不會收到錯誤信息。但它與1+1=2不匹配。它將匹配11l=2在123+111=234。
3字符類或字符集
“字符類(字符集)”僅匹配多個字符中的一個字符。例如你想匹配某個元音字母,你可以將“a、e、i、o、u”這幾個字母用方括號“[]”括起來,這樣你就可以匹配任一元音字符,但是如果是“ae”或“ai”這樣的兩個字符同時出現(xiàn)就無法匹配,只能匹配前一個元音字符。你也可以在字符類中使用連字符來指定字符范圍。例如“[0-9]”可以匹配0-9之間的任一數(shù)字,“[a-Z]”可以匹配任一小寫字母。你還可以在開始方括號“[”后鍵入一個插入符號“∧”來匹配任一不在字符類中的字符。