问题描述
我有一个要更新的集合,如果另一个集合中有匹配项。否则,如果没有匹配项,我想将错误消息字符串追加到列表中。我引用了if/else in a list comprehension来编写代码。
这是我写的:
logstocrunch_set=dirlogs_set.difference(dblogs_set)
pattern = re.compile(r"\d*F[IR]P",re.IGnorECASE) #to find register values
logstocrunch_finset = set()
errorlist = []
logstocrunch_finset.update([x for x if pattern.search(x) else errorlist.append(f'{x} is not proper name') for x in logstocrunch_set])
但是,当我运行此命令时,我得到了错误无效的语法,其中的错误指向我的if语句。
那为什么会这样呢?
解决方法
带有条件的列表理解的语法为:
[<value> for <variable> in <iterable> if <condition>]
if <condition>
在迭代之后,而不是在迭代之后。
此外,您那里不能有else
子句。它不是返回不同值的条件表达式,它只是用于过滤迭代器中的值,因此else
毫无意义。
您似乎将其与<value>
部分中的条件表达式相混淆,该条件表达式使您可以根据条件指定要在结果列表中返回的不同值。那只是一个普通的条件表达式,并非特定于列表推导。
如果要更新多个目标,则不应使用列表推导。使用普通循环。
logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
if pattern.search(x):
logtocrunch_finset.add(x)
else:
errorlist.append(f'{x} is not proper name')
,
列表理解是创建单个列表的一种方法。有条件的基本格式必须为:
[ expression for item in iterable if condition ]
您无法(轻松)一次理解地更新两个对象。另外,声明logstocrunch_finset和错误列表然后填充它们没有太多意义。而是这样的:
pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)
logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]
以下更新-与for循环的性能比较
正如@Barmar建议的那样,我对两个解决方案进行了基准测试。里面没有很多。两种理解似乎更好地处理了较大的输入集。更改有效数据与无效数据的比例似乎并没有太大差别。
import re
range_limit = 10
logstocrunch_set = set(
[f'{i}FRP' for i in range(range_limit)] +
[f'longer_{i}frp_lower' for i in range(range_limit)] +
['not valid','something else']
)
pattern = re.compile(r"\d*F[IR]P",re.IGNORECASE)
%%timeit -n 100000 -r 20
logstocrunch_finset = set()
errorlist = []
for x in logstocrunch_set:
if pattern.search(x):
logstocrunch_finset.add(x)
else:
errorlist.append(f'{x} is not proper name')
- range_limit = 10 |每个循环9.53 µs±34.2 ns(平均±标准偏差,运行20次,每个循环100000次)
- range_limit = 50 |每个循环45.5 µs±699 ns(平均±标准偏差,运行20次,每个循环100000次)
- range_limit = 100 |每个循环89.4 µs±1.2 µs(平均±标准偏差,十次运行,每个100000次循环)
%%timeit -n 100000 -r 20
logstocrunch_finset = {x for x in logstocrunch_set if pattern.search(x)}
errorlist = [f'{x} is not proper name' for x in logstocrunch_set.difference(logstocrunch_finset)]
- range_limit = 10 |每个循环9.58 µs±14.1 ns(平均±标准偏差,共运行20次,每个循环100000次)
- range_limit = 50 |每个循环42.2 µs±24.7 ns(平均±标准偏差,运行20次,每个循环100000次)
- range_limit = 100 |每个循环82.2 µs±491 ns(平均±标准偏差,共10次运行,每个循环100000次)