?
毋庸多言,在vim中正則表達(dá)式得到了十分廣泛的應(yīng)用。 最常用的 / 和 :s 命令中,正則表達(dá)式都是不可或缺的。 下面對(duì)vim中的正則表達(dá)式的一些難點(diǎn)進(jìn)行說明。
關(guān)于magic
vim中有個(gè)magic的設(shè)定。設(shè)定方法為:
:set magic " 設(shè)置magic :set nomagic " 取消magic :h magic " 查看幫助
vim畢竟是個(gè)編輯器,正則表達(dá)式中包含的大量元字符如果原封不動(dòng)地引用(像perl那樣), 勢(shì)必會(huì)給不懂正則表達(dá)式的人造成麻煩,比如 /foo(1) 命令, 大多數(shù)人都用它來查找foo(1)這個(gè)字符串, 但如果按照正則表達(dá)式來解釋,被查找的對(duì)象就成了 foo1 了。
于是,vim就規(guī)定,正則表達(dá)式的元字符必須用反斜杠進(jìn)行轉(zhuǎn)義才行, 如上面的例子,如果確實(shí)要用正則表達(dá)式,就應(yīng)當(dāng)寫成 /foo\(1\) 。 但是,像 . * 這種極其常用的元字符,都加上反斜杠就太麻煩了。 而且,眾口難調(diào),有些人喜歡用正則表達(dá)式,有些人不喜歡用……
為了解決這個(gè)問題,vim設(shè)置了 magic 這個(gè)東西。簡(jiǎn)單地說, magic就是設(shè)置哪些元字符要加反斜杠哪些不用加的。 簡(jiǎn)單來說:
- magic (\m):除了 $ . * ^ 之外其他元字符都要加反斜杠。
- nomagic (\M):除了 $ ^ 之外其他元字符都要加反斜杠。
這個(gè)設(shè)置也可以在正則表達(dá)式中通過 \m \M 開關(guān)臨時(shí)切換。 \m 后面的正則表達(dá)式會(huì)按照 magic 處理,\M 后面的正則表達(dá)式按照 nomagic 處理, 而忽略實(shí)際的magic設(shè)置。
例如:
/\m.* # 查找任意字符串 /\M.* # 查找字符串 .* (點(diǎn)號(hào)后面跟個(gè)星號(hào))
另外還有更強(qiáng)大的 \v 和 \V。
- \v (即 very magic 之意):任何元字符都不用加反斜杠
- \V (即 very nomagic 之意):任何元字符都必須加反斜杠
例如:
/\v(a.c){3}$ # 查找行尾的abcaccadc /\m(a.c){3}$ # 查找行尾的(abc){3} /\M(a.c){3}$ # 查找行尾的(a.c){3} /\V(a.c){3}$ # 查找任意位置的(a.c){3}$
默認(rèn)設(shè)置是 magic,vim也推薦大家都使用magic的設(shè)置,在有特殊需要時(shí),直接通過 \v\m\M\V 即可。
本文下面使用的元字符都是 magic 模式下的。
量詞
vim的量詞與perl相比一點(diǎn)也不遜色。
vim | Perl | 意義 |
* | * | 0個(gè)或多個(gè)(匹配優(yōu)先) |
\+ | + | 1個(gè)或多個(gè)(匹配優(yōu)先) |
\? 或 \= | ? | 0個(gè)或1個(gè)(匹配優(yōu)先),\?不能在 ? 命令(逆向查找)中使用 |
\{n,m} | {n,m} | n個(gè)到m個(gè)(匹配優(yōu)先) |
\{n,} | {n,} | 最少n個(gè)(匹配優(yōu)先) |
\{,m} | {,m} | 最多m個(gè)(匹配優(yōu)先) |
\{n} | {n} | 恰好n個(gè) |
\{-n,m} | {n,m}? | n個(gè)到m個(gè)(忽略優(yōu)先) |
\{-} | *? | 0個(gè)或多個(gè)(忽略優(yōu)先) |
\{-1,} | +? | 1個(gè)或多個(gè)(忽略優(yōu)先) |
\{-,1} | ?? | 0個(gè)或1個(gè)(忽略優(yōu)先) |
從上表中可見,vim的忽略優(yōu)先量詞不像perl的 *? +? ?? 那樣,而是統(tǒng)一使用 \{- 實(shí)現(xiàn)的。 這大概跟忽略優(yōu)先量詞不常用有關(guān)吧。
環(huán)視和固化分組
vim居然還支持環(huán)視和固化分組的功能,強(qiáng)大,贊一個(gè) 關(guān)于環(huán)視的解釋請(qǐng)參考Yurii的 《精通正則表達(dá)式》 一書吧。
vim | Perl | 意義 |
\@= | (?= | 順序環(huán)視 |
\@! | (?! | 順序否定環(huán)視 |
\@<= | (?<= | 逆序環(huán)視 |
\@<! | (?<! | 逆序否定環(huán)視 |
\@> | (?> | 固化分組 |
\%(atom\) | (?: | 非捕獲型括號(hào) |
和perl稍有不同的是,vim中的環(huán)視和固化分組的模式的位置與perl不同。 例如,查找緊跟在 foo 之后的 bar,perl將模式寫在環(huán)視的括號(hào)內(nèi), 而vim將模式寫在環(huán)視的元字符之前。
# Perl的寫法 /(?<=foo)bar/ # vim的寫法 /\(foo\)\@<=bar
元字符 說明
. 匹配任意一個(gè)字符
[abc] 匹配方括號(hào)中的任意一個(gè)字符。可以使用-表示字符范圍,
如[a-z0-9]匹配小寫字母和阿拉伯?dāng)?shù)字。
[^abc] 在方括號(hào)內(nèi)開頭使用^符號(hào),表示匹配除方括號(hào)中字符之外的任意字符。
\d 匹配阿拉伯?dāng)?shù)字,等同于[0-9]。
\D 匹配阿拉伯?dāng)?shù)字之外的任意字符,等同于[^0-9]。
\x 匹配十六進(jìn)制數(shù)字,等同于[0-9A-Fa-f]。
\X 匹配十六進(jìn)制數(shù)字,等同于[^0-9A-Fa-f]。
\w 匹配單詞字母,等同于[0-9A-Za-z_]。
\W 匹配單詞字母之外的任意字符,等同于[^0-9A-Za-z_]。
\t 匹配<TAB>字符。
\s 匹配空白字符,等同于[ \t]。
\S 匹配非空白字符,等同于[^ \t]。
\a 所有的字母字符. 等同于[a-zA-Z]
\l 小寫字母 [a-z]
\L 非小寫字母 [^a-z]
\u 大寫字母 [A-Z]
\U 非大寫字母 [^A-Z]
表示數(shù)量的元字符
元字符 說明
* 匹配0-任意個(gè)
\+ 匹配1-任意個(gè)
\? 匹配0-1個(gè)
\{n,m} 匹配n-m個(gè)
\{n} 匹配n個(gè)
\{n,} 匹配n-任意個(gè)
\{,m} 匹配0-m個(gè)
\_. 匹配包含換行在內(nèi)的所有字符
\{-} 表示前一個(gè)字符可出現(xiàn)零次或多次,但在整個(gè)正則表達(dá)式可以匹配成功的前提下,匹配的字符數(shù)越少越好
\= 匹配一個(gè)可有可無的項(xiàng)
\_s 匹配空格或斷行
\_[]
元字符 說明
\* 匹配 * 字符。
\. 匹配 . 字符。
\/ 匹配 / 字符。
\\ 匹配 \ 字符。
\[ 匹配 [ 字符。
表示位置的符號(hào)
元字符 說明
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾
替換變量
在正規(guī)表達(dá)式中使用 \( 和 \) 符號(hào)括起正規(guī)表達(dá)式,即可在后面使用\1、\2等變量來訪問 \( 和 \) 中的內(nèi)容。
懶惰模式
\{-n,m} 與\{n,m}一樣,盡可能少次數(shù)地重復(fù)
\{-} 匹配它前面的項(xiàng)一次或0次, 盡可能地少
\| "或"操作符
\& 并列
函數(shù)式
:s/替換字符串/\=函數(shù)式
在函數(shù)式中可以使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內(nèi)容,而submatch(0)可以引用匹配的整個(gè)內(nèi)容。
與Perl正則表達(dá)式的區(qū)別 ?
元字符的區(qū)別
Vim語法 Perl語法 含義
\+ + 1-任意個(gè)
\? ? 0-1個(gè)
\{n,m} {n,m} n-m個(gè)
\(和\) (和) 分組
例如:
1,去掉所有的行尾空格:“:%s/\s\+$//”。“%”表示在整個(gè)文件范圍內(nèi)進(jìn)行替換,“\s”表示空白字符(空格和制表符),“\+”對(duì)前面的字符匹配一次或多次(越多越好),“___FCKpd___0rdquo;匹配行尾(使用“\___FCKpd___0rdquo;表示單純的“___FCKpd___0rdquo;字符);被替換的內(nèi)容為空;由于一行最多只需替換一次,不需要特殊標(biāo)志。這個(gè)還是比較簡(jiǎn)單的。(/<Space><Tab>)
2,去掉所有的空白行:“:%s/\(\s*\n\)\+/\r/”。這回多了“\(”、“\)”、“\n”、“\r”和 “*”。“*”代表對(duì)前面的字符(此處為“\s”)匹配零次或多次(越多越好;使用“\*”表示單純的“*”字符),“\n”代表換行符,“\r”代表回車符,“\(”和“\)”對(duì)表達(dá)式進(jìn)行分組,使其被視作一個(gè)不可分割的整體。因此,這個(gè)表達(dá)式的完整意義是,把連續(xù)的換行符(包含換行符前面可能有的連續(xù)空白字符)替換成為一個(gè)單個(gè)的換行符。唯一很特殊的地方是,在模式中使用的是“\n”,而被替換的內(nèi)容中卻不能使用“\n”,而只能使用“\r”。原因是歷史造成的,詳情如果有興趣的話可以查看“:help NL-used-for-Nul”。
3,去掉所有的“//”注釋:“:%s!\ s*//.*!!”。首先可以注意到,這兒分隔符改用了“!”,原因是在模式或字符串部分使用了“/”字符,不換用其他分隔符的話就得在每次使用“/”字符本身時(shí)寫成“\/”,上面的命令得寫成“:%s/\s*\/\/.*//”,可讀性較低。命令本身倒是相當(dāng)簡(jiǎn)單,用過正則表達(dá)式的人估計(jì)都知道“.”匹配表示除換行符之外的任何字符吧。
4,去掉所有的“/* */”注釋:“:%s!\s*/\*\_.\{-}\*/\s*! !g”。這個(gè)略有點(diǎn)復(fù)雜了,用到了幾個(gè)不太常用的 Vim 正則表達(dá)式特性。“\_.”匹配包含換行在內(nèi)的所有字符;“\{-}”表示前一個(gè)字符可出現(xiàn)零次或多次,但在整個(gè)正則表達(dá)式可以匹配成功的前提下,匹配的字符數(shù)越少越好;標(biāo)志“g”表示一行里可以匹配和替換多次。替換的結(jié)果是個(gè)空格的目的是保證像“int/* space not necessary around comments */main()”這樣的表達(dá)式在替換之后仍然是合法的。
:g/^\s*$/d 刪除只有空白的行
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1 將 data1 data2 修改為 data2 data1
:%s/\(\w\+\), \(\w\+\)/\2 \1/ 將 Doe, John 修改為 John Doe
:%s/\<id\>/\=line(".") 將各行的 id 字符串替換為行號(hào)
:%s/\(^\<\w\+\>\)/\=(line(".")-10) .".". submatch(1)
將每行開頭的單詞替換為(行號(hào)-10).單詞的格式,如第11行的word替換成1. word
排序 :/OB/+1,$!sort
參考
vim的幫助文件非常有用,關(guān)于正則表達(dá)式可以參考以下的內(nèi)容。
:h pattern :h magic :h perl-patterns
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
