[正则]正则表达式 捕获型括号和非捕获型括号

正则表达式 捕获型括号和非捕获型括号

对于括号中的子表达式,正则表达式会将匹配的子表达式进行存储。

问题描述

import re
PATH='/Users/Michael/.../app_stat.sh'
CREATE_PATT = '.*?exists.*?(\w+(_\w+)+)\('
with open(PATH) as fr:
    content = fr.read()
    createPatt = re.compile(CREATE_PATT)
    tables = re.findall(createPatt,content)
    print tables

结果如下:

[('mds_anti_app_stat','_stat'),('mds_anti_app_blacklist','_blacklist'),('mds_anti_app_mail','_mail'),('mds_anti_app_few_follow','_follow'),('mds_anti_app_mail_spamfan','_sp
amfan')]

很显然,我想要的结果是

['mds_anti_app_stat','mds_anti_app_blacklist','mds_anti_app_mail','mds_anti_app_few_follow','mds_anti_app_mail_spamfan']

由于
(_\w+)+ 夹杂这一个括号,导致多匹配了一个结果。

解决方

(_\w+)+ 改为 (?:w+)+

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...