日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Vim 中的正則表達(dá)式

系統(tǒng) 2046 0

Vi中的正則表達(dá)式

?

毋庸多言,在vim中正則表達(dá)式得到了十分廣泛的應(yīng)用。 最常用的 / 和 :s 命令中,正則表達(dá)式都是不可或缺的。 下面對(duì)vim中的正則表達(dá)式的一些難點(diǎn)進(jìn)行說明。

關(guān)于magic

vim中有個(gè)magic的設(shè)定。設(shè)定方法為:

    :set magic             " 設(shè)置magic
:set nomagic           " 取消magic
:h magic               " 查看幫助
  

vim畢竟是個(gè)編輯器,正則表達(dá)式中包含的大量元字符如果原封不動(dòng)地引用(像perl那樣), 勢(shì)必會(huì)給不懂正則表達(dá)式的人造成麻煩,比如 /foo(1) 命令, 大多數(shù)人都用它來查找foo(1)這個(gè)字符串, 但如果按照正則表達(dá)式來解釋,被查找的對(duì)象就成了 foo1 了。

于是,vim就規(guī)定,正則表達(dá)式的元字符必須用反斜杠進(jìn)行轉(zhuǎn)義才行, 如上面的例子,如果確實(shí)要用正則表達(dá)式,就應(yīng)當(dāng)寫成 /foo\(1\) 。 但是,像 . * 這種極其常用的元字符,都加上反斜杠就太麻煩了。 而且,眾口難調(diào),有些人喜歡用正則表達(dá)式,有些人不喜歡用……

為了解決這個(gè)問題,vim設(shè)置了 magic 這個(gè)東西。簡(jiǎn)單地說, magic就是設(shè)置哪些元字符要加反斜杠哪些不用加的。 簡(jiǎn)單來說:

  • magic (\m):除了 $ . * ^ 之外其他元字符都要加反斜杠。
  • nomagic (\M):除了 $ ^ 之外其他元字符都要加反斜杠。

這個(gè)設(shè)置也可以在正則表達(dá)式中通過 \m \M 開關(guān)臨時(shí)切換。 \m 后面的正則表達(dá)式會(huì)按照 magic 處理,\M 后面的正則表達(dá)式按照 nomagic 處理, 而忽略實(shí)際的magic設(shè)置。

例如:

    /\m.*          # 查找任意字符串
/\M.*          # 查找字符串 .* (點(diǎn)號(hào)后面跟個(gè)星號(hào))
  

另外還有更強(qiáng)大的 \v 和 \V。

  • \v (即 very magic 之意):任何元字符都不用加反斜杠
  • \V (即 very nomagic 之意):任何元字符都必須加反斜杠

例如:

    /\v(a.c){3}$   # 查找行尾的abcaccadc
/\m(a.c){3}$   # 查找行尾的(abc){3}
/\M(a.c){3}$   # 查找行尾的(a.c){3}
/\V(a.c){3}$   # 查找任意位置的(a.c){3}$
  

默認(rèn)設(shè)置是 magic,vim也推薦大家都使用magic的設(shè)置,在有特殊需要時(shí),直接通過 \v\m\M\V 即可。

本文下面使用的元字符都是 magic 模式下的。

量詞

vim的量詞與perl相比一點(diǎn)也不遜色。

vim Perl 意義
* * 0個(gè)或多個(gè)(匹配優(yōu)先)
\+ + 1個(gè)或多個(gè)(匹配優(yōu)先)
\? 或 \= ? 0個(gè)或1個(gè)(匹配優(yōu)先),\?不能在 ? 命令(逆向查找)中使用
\{n,m} {n,m} n個(gè)到m個(gè)(匹配優(yōu)先)
\{n,} {n,} 最少n個(gè)(匹配優(yōu)先)
\{,m} {,m} 最多m個(gè)(匹配優(yōu)先)
\{n} {n} 恰好n個(gè)
\{-n,m} {n,m}? n個(gè)到m個(gè)(忽略優(yōu)先)
\{-} *? 0個(gè)或多個(gè)(忽略優(yōu)先)
\{-1,} +? 1個(gè)或多個(gè)(忽略優(yōu)先)
\{-,1} ?? 0個(gè)或1個(gè)(忽略優(yōu)先)

從上表中可見,vim的忽略優(yōu)先量詞不像perl的 *? +? ?? 那樣,而是統(tǒng)一使用 \{- 實(shí)現(xiàn)的。 這大概跟忽略優(yōu)先量詞不常用有關(guān)吧。

環(huán)視和固化分組

vim居然還支持環(huán)視和固化分組的功能,強(qiáng)大,贊一個(gè) 關(guān)于環(huán)視的解釋請(qǐng)參考Yurii的 《精通正則表達(dá)式》 一書吧。

vim Perl 意義
\@= (?= 順序環(huán)視
\@! (?! 順序否定環(huán)視
\@<= (?<= 逆序環(huán)視
\@<! (?<! 逆序否定環(huán)視
\@> (?> 固化分組
\%(atom\) (?: 非捕獲型括號(hào)

和perl稍有不同的是,vim中的環(huán)視和固化分組的模式的位置與perl不同。 例如,查找緊跟在 foo 之后的 bar,perl將模式寫在環(huán)視的括號(hào)內(nèi), 而vim將模式寫在環(huán)視的元字符之前。

    # Perl的寫法
/(?<=foo)bar/

# vim的寫法
/\(foo\)\@<=bar
  
vim正則表達(dá)式 寫道


元字符 說明
. 匹配任意一個(gè)字符
[abc] 匹配方括號(hào)中的任意一個(gè)字符。可以使用-表示字符范圍,
如[a-z0-9]匹配小寫字母和阿拉伯?dāng)?shù)字。
[^abc] 在方括號(hào)內(nèi)開頭使用^符號(hào),表示匹配除方括號(hào)中字符之外的任意字符。
\d 匹配阿拉伯?dāng)?shù)字,等同于[0-9]。
\D 匹配阿拉伯?dāng)?shù)字之外的任意字符,等同于[^0-9]。
\x 匹配十六進(jìn)制數(shù)字,等同于[0-9A-Fa-f]。
\X 匹配十六進(jìn)制數(shù)字,等同于[^0-9A-Fa-f]。
\w 匹配單詞字母,等同于[0-9A-Za-z_]。
\W 匹配單詞字母之外的任意字符,等同于[^0-9A-Za-z_]。
\t 匹配<TAB>字符。
\s 匹配空白字符,等同于[ \t]。
\S 匹配非空白字符,等同于[^ \t]。
\a 所有的字母字符. 等同于[a-zA-Z]
\l 小寫字母 [a-z]
\L 非小寫字母 [^a-z]
\u 大寫字母 [A-Z]
\U 非大寫字母 [^A-Z]

表示數(shù)量的元字符
元字符 說明
* 匹配0-任意個(gè)
\+ 匹配1-任意個(gè)
\? 匹配0-1個(gè)
\{n,m} 匹配n-m個(gè)
\{n} 匹配n個(gè)
\{n,} 匹配n-任意個(gè)
\{,m} 匹配0-m個(gè)
\_. 匹配包含換行在內(nèi)的所有字符
\{-} 表示前一個(gè)字符可出現(xiàn)零次或多次,但在整個(gè)正則表達(dá)式可以匹配成功的前提下,匹配的字符數(shù)越少越好
\= 匹配一個(gè)可有可無的項(xiàng)
\_s 匹配空格或斷行
\_[]

元字符 說明
\* 匹配 * 字符。
\. 匹配 . 字符。
\/ 匹配 / 字符。
\\ 匹配 \ 字符。
\[ 匹配 [ 字符。

表示位置的符號(hào)
元字符 說明
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾

替換變量
在正規(guī)表達(dá)式中使用 \( 和 \) 符號(hào)括起正規(guī)表達(dá)式,即可在后面使用\1、\2等變量來訪問 \( 和 \) 中的內(nèi)容。

懶惰模式
\{-n,m} 與\{n,m}一樣,盡可能少次數(shù)地重復(fù)
\{-} 匹配它前面的項(xiàng)一次或0次, 盡可能地少
\| "或"操作符
\& 并列


函數(shù)式
:s/替換字符串/\=函數(shù)式
在函數(shù)式中可以使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內(nèi)容,而submatch(0)可以引用匹配的整個(gè)內(nèi)容。

與Perl正則表達(dá)式的區(qū)別 ?
元字符的區(qū)別
Vim語法 Perl語法 含義
\+ + 1-任意個(gè)
\? ? 0-1個(gè)
\{n,m} {n,m} n-m個(gè)
\(和\) (和) 分組

例如:
1,去掉所有的行尾空格:“:%s/\s\+$//”。“%”表示在整個(gè)文件范圍內(nèi)進(jìn)行替換,“\s”表示空白字符(空格和制表符),“\+”對(duì)前面的字符匹配一次或多次(越多越好),“___FCKpd___0rdquo;匹配行尾(使用“\___FCKpd___0rdquo;表示單純的“___FCKpd___0rdquo;字符);被替換的內(nèi)容為空;由于一行最多只需替換一次,不需要特殊標(biāo)志。這個(gè)還是比較簡(jiǎn)單的。(/<Space><Tab>)
2,去掉所有的空白行:“:%s/\(\s*\n\)\+/\r/”。這回多了“\(”、“\)”、“\n”、“\r”和 “*”。“*”代表對(duì)前面的字符(此處為“\s”)匹配零次或多次(越多越好;使用“\*”表示單純的“*”字符),“\n”代表換行符,“\r”代表回車符,“\(”和“\)”對(duì)表達(dá)式進(jìn)行分組,使其被視作一個(gè)不可分割的整體。因此,這個(gè)表達(dá)式的完整意義是,把連續(xù)的換行符(包含換行符前面可能有的連續(xù)空白字符)替換成為一個(gè)單個(gè)的換行符。唯一很特殊的地方是,在模式中使用的是“\n”,而被替換的內(nèi)容中卻不能使用“\n”,而只能使用“\r”。原因是歷史造成的,詳情如果有興趣的話可以查看“:help NL-used-for-Nul”。
3,去掉所有的“//”注釋:“:%s!\ s*//.*!!”。首先可以注意到,這兒分隔符改用了“!”,原因是在模式或字符串部分使用了“/”字符,不換用其他分隔符的話就得在每次使用“/”字符本身時(shí)寫成“\/”,上面的命令得寫成“:%s/\s*\/\/.*//”,可讀性較低。命令本身倒是相當(dāng)簡(jiǎn)單,用過正則表達(dá)式的人估計(jì)都知道“.”匹配表示除換行符之外的任何字符吧。
4,去掉所有的“/* */”注釋:“:%s!\s*/\*\_.\{-}\*/\s*! !g”。這個(gè)略有點(diǎn)復(fù)雜了,用到了幾個(gè)不太常用的 Vim 正則表達(dá)式特性。“\_.”匹配包含換行在內(nèi)的所有字符;“\{-}”表示前一個(gè)字符可出現(xiàn)零次或多次,但在整個(gè)正則表達(dá)式可以匹配成功的前提下,匹配的字符數(shù)越少越好;標(biāo)志“g”表示一行里可以匹配和替換多次。替換的結(jié)果是個(gè)空格的目的是保證像“int/* space not necessary around comments */main()”這樣的表達(dá)式在替換之后仍然是合法的。

:g/^\s*$/d 刪除只有空白的行
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1 將 data1 data2 修改為 data2 data1
:%s/\(\w\+\), \(\w\+\)/\2 \1/ 將 Doe, John 修改為 John Doe
:%s/\<id\>/\=line(".") 將各行的 id 字符串替換為行號(hào)
:%s/\(^\<\w\+\>\)/\=(line(".")-10) .".". submatch(1)
將每行開頭的單詞替換為(行號(hào)-10).單詞的格式,如第11行的word替換成1. word
排序 :/OB/+1,$!sort
?


參考

vim的幫助文件非常有用,關(guān)于正則表達(dá)式可以參考以下的內(nèi)容。

    :h pattern
:h magic
:h perl-patterns
  

Vim 中的正則表達(dá)式


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 宜章县| 夹江县| 宿松县| 海门市| 高尔夫| 长汀县| 同心县| 兴宁市| 阳城县| 拉萨市| 昭平县| 玛多县| 镶黄旗| 东乌珠穆沁旗| 诸城市| 新丰县| 平湖市| 清水河县| 从江县| 剑河县| 城固县| 望城县| 洪泽县| 巩义市| 淳化县| 西峡县| 泰宁县| 塔河县| 双江| 仙居县| 麻江县| 盐边县| 临汾市| 庆元县| 绥江县| 罗定市| 隆昌县| 澄江县| 南安市| 庆阳市| 柯坪县|