具有正确格式的列表理解条件的SyntaxError

问题描述

我有一个要更新的集合，如果另一个集合中有匹配项。否则，如果没有匹配项，我想将错误消息字符串追加到列表中。我引用了if/else in a list comprehension来编写代码。

这是我写的：

logstocrunch_set=dirlogs_set.difference(dblogs_set)
pattern = re.compile(r"\d*F[IR]P",re.IGnorECASE)  #to find register values
logstocrunch_finset = set()
errorlist = []
logstocrunch_finset.update([x for x if pattern.search(x) else errorlist.append(f'{x} is not proper name') for x in logstocrunch_set])

但是，当我运行此命令时，我得到了错误无效的语法，其中的错误指向我的if语句。

那为什么会这样呢？

解决方法

带有条件的列表理解的语法为：

[<value> for <variable> in <iterable> if <condition>]

if <condition>在迭代之后，而不是在迭代之后。

此外，您那里不能有else子句。它不是返回不同值的条件表达式，它只是用于过滤迭代器中的值，因此else毫无意义。

您似乎将其与<value>部分中的条件表达式相混淆，该条件表达式使您可以根据条件指定要在结果列表中返回的不同值。那只是一个普通的条件表达式，并非特定于列表推导。

如果要更新多个目标，则不应使用列表推导。使用普通循环。

logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
    if pattern.search(x):
        logtocrunch_finset.add(x)
    else:
        errorlist.append(f'{x} is not proper name')

列表理解是创建单个列表的一种方法。有条件的基本格式必须为：

[ expression for item in iterable if condition ]

您无法（轻松）一次理解地更新两个对象。另外，声明logstocrunch_finset和错误列表然后填充它们没有太多意义。而是这样的：

pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)
logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]

以下更新-与for循环的性能比较

正如@Barmar建议的那样，我对两个解决方案进行了基准测试。里面没有很多。两种理解似乎更好地处理了较大的输入集。更改有效数据与无效数据的比例似乎并没有太大差别。

import re

range_limit = 10
logstocrunch_set = set(
    [f'{i}FRP' for i in range(range_limit)] + 
    [f'longer_{i}frp_lower' for i in range(range_limit)] + 
    ['not valid','something else']
)
pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)

%%timeit -n 100000 -r 20

logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
    if pattern.search(x):
        logstocrunch_finset.add(x)
    else:
        errorlist.append(f'{x} is not proper name')

range_limit = 10 |每个循环9.53 µs±34.2 ns（平均±标准偏差，运行20次，每个循环100000次）
range_limit = 50 |每个循环45.5 µs±699 ns（平均±标准偏差，运行20次，每个循环100000次）
range_limit = 100 |每个循环89.4 µs±1.2 µs（平均±标准偏差，十次运行，每个100000次循环）

%%timeit -n 100000 -r 20

logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]

range_limit = 10 |每个循环9.58 µs±14.1 ns（平均±标准偏差，共运行20次，每个循环100000次）
range_limit = 50 |每个循环42.2 µs±24.7 ns（平均±标准偏差，运行20次，每个循环100000次）
range_limit = 100 |每个循环82.2 µs±491 ns（平均±标准偏差，共10次运行，每个循环100000次）

list-comprehension python python-3.x