正则贪婪模式vs非贪婪模式详解

 我来答
天然槑17
2022-06-14 · TA获得超过1.1万个赞
知道大有可为答主
回答量:6314
采纳率:100%
帮助的人:35.6万
展开全部

作为开始,我们看看下面的正则:

我们本来预想上面会匹配得到 witch 和 broom 两个字符串,运行上面的例子,却发现结果只匹配到 "witch" and her "broom" 一个字符串。
之所以出现这个结局,是因为正则的贪婪模式在起作用。查找算法首先我们假设自己是正则引擎,来模拟搜索实现的过程。 正则引擎先从字符串的第0位开始搜索。 1. 第一个查找字符是 " ,正则引擎在第三个位置匹配到了它:

. 代表任意字符重复一次到多次,因此正则引擎匹配到所有字符

当文本结束后,点的匹配停止了,但仍然有剩余的的正则需要匹配,即: "
因此,正则引擎开始倒过来回溯,换句话说,就是一个字符一个字符缩减匹配。

因此正则继续缩减 . 所重复的字符,再继续尝试。

现在 " 终于匹配上了。 如果正则是global的,正则引擎会从上次匹配结果之后继续查找更多结果。

再看一个例子:

在这个例子中,因为 * 的存在,使得正则表达式具有贪婪属性,操作模式同上,先匹配第一个 " 找到了witch前的 " ,第二步匹配 . ,因为可以代表除了行结束符和换行符号的所有符号,因此直接跳到文本结尾 e ,接下来匹配 " ,找到 m 后面的 " ,接着匹配 " 后的空格,在匹配空格后的 a ,此时发现没有,则失败,重新寻找 " ;最终匹配到 "witch" a 。
总结:在贪婪(默认)模式下,正则引擎尽可能多的重复匹配字符
非贪婪模式
非贪婪模式和贪婪模式相反,可通过在代表数量的标示符后放置 ? 来开启非贪婪模式,如 ? 、 +? 甚至是 ?? 。

我们来看看非贪婪模式 .? 是怎么运转的。

下面是二者的重要区别。 正则引擎尝试用 最小可能 的重复次数来进行匹配,因此在 . 匹配了 w 后,它立即尝试 " 的匹配

下面终于匹配上了

因为正则是global的,所以正则引擎继续后面的匹配,从引号后面的 a 字符开始。后面有匹配到第二个字符串

总结:在非贪婪模式下,正则引擎尽可能少的重复匹配字符

本文引用若愚老师博客,仅用于学习使用,特此声明!

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式