正则表达式 捕获型括号和非捕获型括号
对于括号中的子表达式,正则表达式会将匹配的子表达式进行存储。
问题描述
import re
PATH='/Users/Michael/.../app_stat.sh'
CREATE_PATT = '.*?exists.*?(\w+(_\w+)+)\('
with open(PATH) as fr:
content = fr.read()
createPatt = re.compile(CREATE_PATT)
tables = re.findall(createPatt,content)
print tables
结果如下:
[('mds_anti_app_stat','_stat'),('mds_anti_app_blacklist','_blacklist'),('mds_anti_app_mail','_mail'),('mds_anti_app_few_follow','_follow'),('mds_anti_app_mail_spamfan','_sp amfan')]
很显然,我想要的结果是
['mds_anti_app_stat','mds_anti_app_blacklist','mds_anti_app_mail','mds_anti_app_few_follow','mds_anti_app_mail_spamfan']
由于
(_\w+)+
夹杂这一个括号,导致多匹配了一个结果。
解决方案
将 (_\w+)+
改为 (?:w+)+