javascript - 正则表达式的贪婪\非贪婪模式怎么理解？

查看：105 发布时间：2017/9/6 8:48:45 javascript 正则表达式 python爬虫 python

本文介绍了javascript - 正则表达式的贪婪\非贪婪模式怎么理解？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

问题

最近在学习Python相关的正则表达式，对其中的贪婪和非贪婪模式的概念有点模糊，希望借下面几个例子，能理解一下它们的区别：
例子1：

为何会出现这样的结果呢？
[out]12为何还多了一个空字符出来呢？

In [12]: re.match(r'^(\d+)(0*)$', '102300').groups()
Out[12]: ('102300', '')
In [13]: >>> re.match(r'^(\d+?)(0*)$', '102300').groups()
Out[13]: ('1023', '00')

例子2：为什么加了?，得到的结果就不一样了呢？

In [7]: import re

In [8]:  r=re.findall(r'<title.*?\/title>','<title>首页 - CK的官方网站</title>,<title>首页 - Michael翔的官方网站</title>')

In [9]: r
Out[9]: ['<title>首页 - CK的官方网站</title>', '<title>首页 - Michael翔的官方网站</title>']

In [10]:  r=re.findall(r'<title.*\/title>','<title>首页 - CK的官方网站</title>,<title>首页 - Michael翔的官方网站</title>
')
In [11]: r
Out[11]: ['<title>首页 - CK的官方网站</title>,<title>首页 - Michael翔的官方网站</title>']

解决方案

d+表示找到一个或多个数字，但期望的是更长的串；d+？表示去匹配满足要求的尽可能短的串。

圆括号，表示要捕获的分组。

在这个例子中，在(\d+)会把102300都匹配完，(0*)因为可以匹配零个或者多个0，这里0个0也会被捕获，所以出现了空串。

In [12]: re.match(r'^(\d+)(0*)$', '102300').groups()
Out[12]: ('102300', '')

在这个例子中，为了匹配到尽可能短的串，就把0分给了后面的(0*)分组了。

In [13]: >>> re.match(r'^(\d+?)(0*)$', '102300').groups()
Out[13]: ('1023', '00')

这篇关于javascript - 正则表达式的贪婪\非贪婪模式怎么理解？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

javascript - 正则表达式的贪婪\非贪婪模式怎么理解？

问题描述

相关文章

前端开发最新文章

热门教程

热门工具

登录关闭

javascript - 正则表达式的贪婪\非贪婪模式怎么理解？

问题描述

相关文章

前端开发最新文章

热门教程

热门工具

登录 关闭

登录关闭