A JavaScript Fancier

伟大的javascript技术研究中...

  IT博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  304 随笔 :: 0 文章 :: 479 评论 :: 0 Trackbacks


以前看正则表达式,但没有注意到正则表达式的贪婪与非贪婪模式,今天在经典上看到了这么段代码:
<script>
try{
str
="<p>abcdefg</p><p>abcdefghijkl</p>";

re1
=str.match(/<p>[\W\w]+?<\/p>/ig);
alert(
"非贪婪模式:\r\n\r\n1:"+re1[0]+"\r\n2:"+re1[1]);

re1
=str.match(/<p>[\W\w]+<\/p>/ig);
alert(
"贪婪模式:\r\n\r\n"+re1);

re1
=str.match(/<p>(.+?)<\/p>/i);
alert(
"非贪婪模式,且不要标记:\r\n\r\n1:"+re1[1]);

re1
=str.match(/<p>(.+)<\/p>/i);
alert(
"贪婪模式,且不要标记:\r\n\r\n"+re1[1]);
}
catch(e){alert(e.description)}
</script>


 匹配次数中的贪婪与非贪婪

    在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同一个表达式能够匹配不同的次数,比如:"{m,n}", "{m,}", "?", "*", "+",具体匹配的次数随被匹配的字符串而定。这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。比如,针对文本 "dxxxdxxxd",举例如下:

表达式

匹配结果

(d)(\w+)

"\w+" 将匹配第一个 "d" 之后的所有字符 "xxxdxxxd"

(d)(\w+)(d)

"\w+" 将匹配第一个 "d" 和最后一个 "d" 之间的所有字符 "xxxdxxx"。虽然 "\w+" 也能够匹配上最后一个 "d",但是为了使整个表达式匹配成功,"\w+" 可以 "让出" 它本来能够匹配的最后一个 "d"

    由此可见,"\w+" 在匹配的时候,总是尽可能多的匹配符合它规则的字符。虽然第二个举例中,它没有匹配最后一个 "d",但那也是为了让整个表达式能够匹配成功。同理,带 "*" 和 "{m,n}" 的表达式都是尽可能地多匹配,带 "?" 的表达式在可匹配可不匹配的时候,也是尽可能的 "要匹配"。这 种匹配原则就叫作 "贪婪" 模式 。

    非贪婪模式:

    在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 "不匹配"。这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式。如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹配成功。举例如下,针对文本 "dxxxdxxxd" 举例:

表达式

匹配结果

(d)(\w+?)

"\w+?" 将尽可能少的匹配第一个 "d" 之后的字符,结果是:"\w+?" 只匹配了一个 "x"

(d)(\w+?)(d)

为了让整个表达式匹配成功,"\w+?" 不得不匹配 "xxx" 才可以让后边的 "d" 匹配,从而使整个表达式匹配成功。因此,结果是:"\w+?" 匹配 "xxx"

    更多的情况,举例如下:

    举例1:表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。

    举例2:相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。


posted on 2006-06-22 12:12 Yemoo'S JS Blog 阅读(16353) 评论(11)  编辑 收藏 引用 所属分类: 正则表达式专题

评论

# re: 关于正则表达式的贪婪与非贪婪模式 2006-06-23 13:33 电脑技术
e.description

  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2006-08-07 20:38 Eric
现在清楚了!  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式[未登录] 2007-12-31 17:09 bill
谢谢。  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2009-01-09 23:20 hunmr
今天才明白这个东东。谢谢共享。  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2009-09-26 20:49 格子
终于明白了,感谢  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2009-11-10 11:57 xyz
曾经让我困扰的问题,非常感谢  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2009-12-08 16:24 rainee lee
thank you very very very much!!!  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2010-06-12 11:34 快播
终于明白了, 3q  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2010-12-27 14:53 QQ328496647
例如我想匹配HTML代码中的表格:
/<table[^>]*>.*<\/table>/isU
当表格有一百多条数据的时间贪婪模式能匹配到这个表格,当数量再多的时候就匹配不到了。  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2012-06-07 16:40 k.q.
这个可以很简单的匹配C风格的注释:
someStr.match(/\/\*(.)*?\*\//g);  回复  更多评论
  

# re: 关于正则表达式的贪婪与非贪婪模式 2013-04-24 15:58 风柏杨
以前有看过,今天用到的时候又忘了,过来学习一下,谢谢分享  回复  更多评论
  

只有注册用户登录后才能发表评论。