一般情況下用正則寫法為: [Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]如果遇到大數據的變長字符串的話就會發現這個是很耗資源的。效率并不高,有的時候甚至無法忍受。 請在這里寫足夠多的空格或者tab字符。</textarea> [Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]在解釋這個原因的時候想起以前看到master regular expression里面有提到過。NFA和DFA的引擎是有區別的。js/perl/php/Java/.NET都是NFA引擎。 而DFA與NFA機制上的不同帶來5個影響: 1. DFA對于文本串里的每一個字符只需掃描一次,比較快,但特性較少;NFA要翻來覆去吃字符、吐字符,速度慢,但是特性豐富,所以反而應用廣泛,當今主要的正則表達式引擎,如Perl、Ruby、Python的re模塊、Java和.NET的regex庫,都是NFA的。 2. 只有NFA才支持lazy和backreference(后向引用)等特性; 3. NFA急于邀功請賞,所以最左子正則式優先匹配成功,因此偶爾會錯過最佳匹配結果;DFA則是“最長的左子正則式優先匹配成功”。 4. NFA缺省采用greedy量詞(就是對于/.*/、//w+/這樣的“重復n”次的模式,以貪婪方式進行,盡可能匹配更多字符,直到不得以罷手為止),NFA會優先匹配量詞。 5. NFA可能會陷入遞歸調用的陷阱而表現得性能極差。 backtracking(回朔) 當NFA發現自己吃多了,一個一個往回吐,邊吐邊找匹配,這個過程叫做backtracking。由于存在這個過程,在NFA匹配過程中,特別是在編寫不合理的正則式匹配過程中,文本被反復掃描,效率損失是不小的。明白這個道理,對于寫出高效的正則表達式很有幫助。 定位/分析原因 在解釋上面的trim原型方法的時候。經過測試,先不說結果是否正確,有幾個方法是可以化解JS NFA引擎的回朔次數的 a. 去掉限定的量詞,即改成復制代碼 代碼如下:String.prototype.trim = function () { return this.replace(/^[/s/t ]+|[/s/t ]$/g, ''); }b. 去掉字符串尾匹配。即改成: 復制代碼 代碼如下:String.prototype.trim = function () { return this.replace(/^[/s/t ]+/g, ''); } c.加入多行匹配。即改成: 復制代碼 代碼如下:String.prototype.trim = function () { return this.replace(/^[/s/t ]+|[/s/t ]+$/mg, ''); }從以上三種改法結合文中開頭的NFA資料,我們可以大概的知道trim性能出現問題的原因 量詞限定將優先匹配。 量詞限定在結尾可能會使JS的正則引擎不停的回朔,出現遞歸的一個陷阱,這個遞歸的深度太深。如果字符串更大一點應該會出現棧溢出了。 多行既然能夠匹配,而且性能消耗不大。性能上沒有任何問題,從一個寫這個正則程序的人角度上去看,多行明顯比單行要替換的空串多得多。所以第二點的結論應該是對的 改良 首先確定匹配字符串的開始正則是沒有任何效率問題的。而匹配結束的時候會出現性能問題,那可以采用正則與傳統相結合來改善這個trim性能問題。 例如: [Ctrl+A 全選 注:如需引入外部Js需刷新才能執行] JavaScript技術:trim原型函數看js正則表達式的性能,轉載需保留來源! 鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。