如何将重叠的key:value声明与正则表达式匹配?

问题描述

问题陈述:

  • 查询的格式必须为field:value

  • 该值可以包含任意数量的单词,例如field:my value

  • 该值也可以是正则表达式。要执行此操作,请使用两个 冒号field::value.*

  • 最后,您可以指定任意数量的字段/值对。 例如,field1:value 1 field2::value2

问题是,我不知道如何匹配 如果field2存在或不存在,则可靠地显示“值1”。

到目前为止我所拥有的:

r'(\S+?):'  # match field
r'(:?)'     # capture extra : if regex value
r'(.+?(?=\s\S+:))|(.+(?!\s\S+:))'  # match value,but don't capture field2 if it exists

我在为最后一部分苦苦挣扎。 (.+?(?=\s\S+:))会在field2存在的情况下执行我想要的操作,但是如果field2不存在,这将无法正常工作。

然后的想法是调用matches = re.findall(QUERY_REGEX,query)获取所有匹配项。因此,对于给出的最后一个示例,输出应为[('field1','','value 1'),('field2',':','value2')]

解决方法

您可以使用以下模式:

(\S+)::?(.+?)(?=\s\S+:|$)

Demo

这有两个捕获组;一个用于键,一个用于值。如果需要,您可以添加更多组。

对Lookahead的主要更改是检查“值”后面是否有另一个键,或者它是否位于行尾。