来自列表理解的字典

问题描述

我有以下清单。

arr_lst = [(1,34,99),(2,35,40),36,50),37,10),(3,90),38,8)]

我找到了字典键,它是元组中的第一项。

keys = {i[0] for i in arr_lst}
# output
# {1,2,3)

从那里,我创建了一个字典,如果元组中的第一项与之前定义的键匹配,则其值为第一个列表中的元组

id_dict = dict()
for k in keys:
    id_dict[k] = [i for i in arr_lst if i[0] == k]
# output
# {1: [(1,99)],2: [(2,10)],3: [(3,8)]}

然后我创建了一个新列表,其元素是基于字典值的元组。将第三项在字典值中最高的元组附加到列表中,并删除第三项。

output_id_etak_id = []
for k,v in id_dict.items():
    m = max(v,key=lambda x: x[2])
    output_id_etak_id.append(m[:2])
# output
# [(1,34),36),37)]

代码有效,我得到了想要的输出。但是,我在第一个列表中有一个包含超过 800 000 个元素的大型数据集,目前运行大约需要 3 个小时。我想找到一种方法让它更快。

解决方法

您可以itertools.groupby(期望已排序的输入)基于元组第一个元素形成组,然后使用 next(由 @tobias-k 建议)选择该组的第一个元素。

注意:为了使用 next,我们需要使用比较键 x[0],-x[-1] 对列表进行排序,以便形成的组在降序。

from itertools import groupby

arr_lst = [(1,34,99),(2,35,40),36,50),37,10),(3,90),38,8)]
arr_lst = sorted(arr_lst,key=lambda x: (x[0],-x[-1]))
result = [
    next(group)[:2]
    for key,group in groupby(arr_lst,key=lambda x: x[0])
]
,

Key = 第一个元素;值 = 第三个元素最大值的第二个元素

如果你想要第三个元素具有最大值的第二个元素,那么你可以使用这个代码:

arr_lst = [(1,8)]
arr_dict = {}
arr_temp = {}
for arr in arr_lst:
    x = arr_temp.get(arr[0],-1)
    if arr[2] > x:
        arr_temp[arr[0]] = arr[2]
        arr_dict[arr[0]] = arr[1]

arr_relist = [(k,v) for k,v in arr_dict.items()]

print (arr_relist)

输出结果为:

[(1,34),36),37)]

时间是:

For dictionary:

841 ns ± 21.7 ns per loop (mean ± std. dev. of 7 runs,1000000 loops each)

Including recreating the list with tuples:

1.18 µs ± 41.1 ns per loop (mean ± std. dev. of 7 runs,1000000 loops each)

Key = 第一个元素;值 = 第三个元素的最大值

根据评论部分,我假设您希望元组中的第一项是键,而元组中第三项的最大值是键的值。

为此,您只需在循环中迭代一次。

您的代码将是:

arr_lst = [(1,8)]
arr_dict = {}
for arr in arr_lst:
    x = arr_dict.get(arr[0],-1)
    if arr[2] > x: arr_dict[arr[0]] = arr[2]

print (arr_dict)

输出结果为:

{1: 99,2: 50,3: 90}

我检查了这个时间:

792 ns ± 15.6 ns per loop (mean ± std. dev. of 7 runs,1000000 loops each)
,

您可以使用 itertools.groupbymap 来完成此任务

import itertools
arr_lst = [(1,8)]

def max_2_1(arr):
    maxItem = next(arr)
    for item in arr:
        if item[2] > maxItem[2]:
            maxItem = item
    return maxItem[1]
    
arr_lst.sort(key = lambda kk: kk[0]) # important as groupby rely on this
aa = map( 
    lambda keygroup: [ keygroup[0],max_2_1( keygroup[1] )  ],itertools.groupby(arr_lst,key=lambda item: item[0])
)   
print(list(aa)) # [[1,34],[2,36],[3,37]]

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...