正则表达式之最短匹配

Python正则表达式:最短匹配

最短匹配应用于:假如有一段文本,你只想匹配最短的可能,而不是最长。

例子

比如有一段html片段,’\this is first label\the second label\’,如何匹配出每个a标签中的内容,下面来看下最短与最长的区别。

代码

import re
str = ‘this is first labelthe second label

print re.findall(r’(.*?)‘,str) # 最短匹配
[‘this is first label’,‘the second label’]

print re.findall(r’(.*)‘,str)
[‘this is first labelthe second label’]
解释

例子中,模式r’(.?)’的意图是匹配被和包含的文本,但是正则表达式中操作符是贪婪的,因此匹配操作会查找出最长的可能。 但是在*操作符后面加上?操作符,这样使得匹配变成非贪婪模式,从而得到最短匹配。

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...