如何在正则表达式中使用带有字符的“环视”时捕获整个字符串?

我必须找到仅由字母’a’和’b’组成的所有字符串,并且’a’的每个实例后面紧跟’b’并且紧跟在’b’之后.

例如:

mystring = 'bab babab babbab ab baba aba xyz'

然后我的正则表达式应该返回:

['bab' 'babab' 'babbab']  

(在字符串’ab’中 – ‘a’前面没有’b’.类似地’aba’和’xyz’不仅仅是’a’,’b’.)

我使用了lookahead为此写了这个正则表达式:

re.findall(r'((?<=b)a(?=b))',mystring)

但这只会让我回复所有’a’的实例,这些实例后跟/前面跟’b’,如:

['a','a','a']

但我需要完整的话.如何使用正则表达式找到整个单词?我尝试用各种选项修改我的正则表达式,但似乎没有任何效果.如何才能做到这一点?

最佳答案
您可以使用以下正则表达式:

>>> re.findall(r'\b(?:b+a)+b+\b',mystring)
['bab','babab','babbab']

Debuggex Demo

正如您在前面的图表中所看到的,这个正则表达式将匹配ba的任何组合(其中b可以呈现多于一次),其产生每个先于b的单词然后整个字符串可以跟随一个或多个b.

相关文章

本文从多个角度分析了vi编辑器保存退出命令。我们介绍了保存...
Python中的回车和换行是计算机中文本处理中的两个重要概念,...
SQL Server启动不了错误1067是一种比较常见的故障,主要原因...
信息模块是一种可重复使用的、可编程的、可扩展的、可维护的...
本文从电脑配置、PyCharm版本、Java版本、配置文件以及程序冲...
本文主要从多个角度分析了安装SQL Server 2012时可能出现的错...