问题描述
问题陈述:
-
查询的格式必须为
field:value
。 -
该值可以包含任意数量的单词,例如
field:my value
。 -
该值也可以是正则表达式。要执行此操作,请使用两个 冒号
field::value.*
。 -
最后,您可以指定任意数量的字段/值对。 例如,
field1:value 1 field2::value2
。
问题是,我不知道如何匹配 如果field2存在或不存在,则可靠地显示“值1”。
到目前为止我所拥有的:
r'(\S+?):' # match field
r'(:?)' # capture extra : if regex value
r'(.+?(?=\s\S+:))|(.+(?!\s\S+:))' # match value,but don't capture field2 if it exists
我在为最后一部分苦苦挣扎。 (.+?(?=\s\S+:))
会在field2存在的情况下执行我想要的操作,但是如果field2不存在,这将无法正常工作。
然后的想法是调用matches = re.findall(QUERY_REGEX,query)
以获取所有匹配项。因此,对于给出的最后一个示例,输出应为[('field1','','value 1'),('field2',':','value2')]
解决方法
您可以使用以下模式:
(\S+)::?(.+?)(?=\s\S+:|$)
Demo 。
这有两个捕获组;一个用于键,一个用于值。如果需要,您可以添加更多组。
对Lookahead的主要更改是检查“值”后面是否有另一个键,或者它是否位于行尾。