乱码乱a∨中文字幕,在线免费激情视频,亚洲欧美久久夜夜潮,国产在线网址

  1. <sub id="hjl7n"></sub>

    1. <sub id="hjl7n"></sub>

      <legend id="hjl7n"></legend>

      當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  編程技術(shù) >  正文

      js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇

       2020-11-02 16:53  來(lái)源: 腳本之家   我來(lái)投稿 撤稿糾錯(cuò)

        阿里云優(yōu)惠券 先領(lǐng)券再下單

      昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個(gè)不錯(cuò)的表達(dá)式,因?yàn)榭梢詽M足我們的要求,所以這個(gè)表達(dá)式可用,但不一定是最好的

      昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個(gè)不錯(cuò)的表達(dá)式,因?yàn)榭梢詽M足我們的要求,所以這個(gè)表達(dá)式可用,但不一定是最好的。

      從性能上來(lái)說(shuō),他非常糟糕,為什么這么說(shuō)呢,因?yàn)?傳統(tǒng)型NFA引擎 遇到分支是從左往右匹配的,

      所以它會(huì)用 \\. 去匹配每一個(gè)字符,發(fā)現(xiàn)不對(duì)后才用 [^"] 去匹配。

      比如這樣一個(gè)字符串: "123456\'78\"90"

      共 16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),只有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),所以 \\. 會(huì)失敗 10 次,只有 2 次成功。

      這 10 次匹配失敗,需要回溯后用 [^"] 才能匹配成功,當(dāng)然最后一個(gè) " 會(huì)直接匹配成功。

      很明顯,正常的字符串不可能全是轉(zhuǎn)義,正常的字符串才是主流,當(dāng)然不排除有人故意全轉(zhuǎn)義的情況。

      所以這個(gè)正則需要10次回溯后才能匹配完成,如果字符串增長(zhǎng)到 1K 1M 腫么破呢?

      所以我們要修改下這個(gè)正則,前后換下位置么?

      js 中 字符串用 \ 折行是允許的,但是修改后的 正則 沒(méi)法匹配這樣的字符串了,所以我們還得繼續(xù)修復(fù)。

      因?yàn)?. 沒(méi)法匹配換行,所以我們要用其他方式表達(dá)。

      . 是用于匹配除換行符之外的所有字符,難道我們要 [.\n] 來(lái)表示么?

      這樣是不對(duì)的,因?yàn)?[] 字符集中的 . 不再表示除換行符之外的所有字符,而是字符 . 也就是他本身一個(gè)字符而已。

      那怎么辦呢?

      其實(shí)換個(gè)思路,

      \d 表示 0-9

      \D 表示 [^0-9]

      那么 [\d\D] 就表示所有了,不是么。(新人朋友不知道能不能消化這個(gè)知識(shí)點(diǎn)。)

      同理 [\s\S] [\w\W] 同樣可以。

      所以 /"(?:[^"\\]|\\[\d\D])*"/ 這樣就滿足我們的要求了。

      效果不錯(cuò)。

      回頭過(guò)來(lái)分分析下他現(xiàn)在的性能吧。

      還是這個(gè)字符串: "123456\'78\"90" , 正則 /"(?:[^"\\]|\\[\d\D])*"/

      共 16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),[^"\\] 能匹配成功 10 個(gè)字符,只有 2 次失敗。

      為什么不是 4 次失敗呢,明明有4個(gè)字符啊。\\ 雖然是2個(gè)字符,但是讀到第一個(gè) \ 就匹配失敗,然后用 \\[\d\D] 匹配成功,

      占用掉了兩個(gè)字符 \\ 下次用下一個(gè)o開(kāi)始匹配,所以只有2次回溯。

      只有 2 次需要回溯,然后用 \\[\d\D] 匹配成功。當(dāng)然最后一個(gè) " 還是會(huì)直接匹配成功。

      所以從 10 次回溯,減少到了 2 次,雖然正則比昨天臃腫了很多,但至少性能提升了不止一個(gè)等級(jí)。

      OK,今天的分享完畢,明天見(jiàn)。

      來(lái)源:腳本之家

      鏈接:https://www.jb51.net/article/184337.htm

      申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

      相關(guān)標(biāo)簽
      正則表達(dá)式

      相關(guān)文章

      熱門(mén)排行

      信息推薦