具有正确格式的列表理解条件的SyntaxError

问题描述

我有一个要更新的集合,如果另一个集合中有匹配项。否则,如果没有匹配项,我想将错误消息字符串追加到列表中。我引用了if/else in a list comprehension来编写代码

这是我写的:

logstocrunch_set=dirlogs_set.difference(dblogs_set)
pattern = re.compile(r"\d*F[IR]P",re.IGnorECASE)  #to find register values
logstocrunch_finset = set()
errorlist = []
logstocrunch_finset.update([x for x if pattern.search(x) else errorlist.append(f'{x} is not proper name') for x in logstocrunch_set])

但是,当我运行此命令时,我得到了错误无效的语法,其中的错误指向我的if语句。

那为什么会这样呢?

解决方法

带有条件的列表理解的语法为:

[<value> for <variable> in <iterable> if <condition>]

if <condition>在迭代之后,而不是在迭代之后。

此外,您那里不能有else子句。它不是返回不同值的条件表达式,它只是用于过滤迭代器中的值,因此else毫无意义。

您似乎将其与<value>部分中的条件表达式相混淆,该条件表达式使您可以根据条件指定要在结果列表中返回的不同值。那只是一个普通的条件表达式,并非特定于列表推导。

如果要更新多个目标,则不应使用列表推导。使用普通循环。

logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
    if pattern.search(x):
        logtocrunch_finset.add(x)
    else:
        errorlist.append(f'{x} is not proper name')
,

列表理解是创建单个列表的一种方法。有条件的基本格式必须为:

[ expression for item in iterable if condition ]

您无法(轻松)一次理解地更新两个对象。另外,声明logstocrunch_finset和错误列表然后填充它们没有太多意义。而是这样的:

pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)
logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]

以下更新-与for循环的性能比较

正如@Barmar建议的那样,我对两个解决方案进行了基准测试。里面没有很多。两种理解似乎更好地处理了较大的输入集。更改有效数据与无效数据的比例似乎并没有太大差别。

import re

range_limit = 10
logstocrunch_set = set(
    [f'{i}FRP' for i in range(range_limit)] + 
    [f'longer_{i}frp_lower' for i in range(range_limit)] + 
    ['not valid','something else']
)
pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)
%%timeit -n 100000 -r 20

logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
    if pattern.search(x):
        logstocrunch_finset.add(x)
    else:
        errorlist.append(f'{x} is not proper name')
  • range_limit = 10 |每个循环9.53 µs±34.2 ns(平均±标准偏差,运行20次,每个循环100000次)
  • range_limit = 50 |每个循环45.5 µs±699 ns(平均±标准偏差,运行20次,每个循环100000次)
  • range_limit = 100 |每个循环89.4 µs±1.2 µs(平均±标准偏差,十次运行,每个100000次循环)
%%timeit -n 100000 -r 20

logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]
  • range_limit = 10 |每个循环9.58 µs±14.1 ns(平均±标准偏差,共运行20次,每个循环100000次)
  • range_limit = 50 |每个循环42.2 µs±24.7 ns(平均±标准偏差,运行20次,每个循环100000次)
  • range_limit = 100 |每个循环82.2 µs±491 ns(平均±标准偏差,共10次运行,每个循环100000次)