从 Pandas 高效创建字典的 Pythonic 方法

问题描述

我有一个 Pandas 数据框,其中包含 iddate_createdrank_1rank_2rank_3 列。下面显示了数据框的 2 行。

id 创建日期 rank_1 rank_2 rank_3
2223 3/3/21 3:26 www.google.com www.yahoo.com www.ford.com
1112 2/25/21 1:35 www.autoblog.com www.motor1.com www.webull.com

我正在尝试为此 df 分配一个新列并将其命名为 rank_dict,这会将数字 3 分配给 rank_1 URL,将数字 2 分配给 rank_2 URL,将数字 1 分配给 rank_3 URL。 所以理想的结果应该是这样的:

id 创建日期 rank_1 rank_2 rank_3 rank_dict
2223 3/3/21 3:26 www.google.com www.yahoo.com www.ford.com {www.google.com:3,www.yahoo.com:2,www.ford.com:1}
1112 2/25/21 1:35 www.autoblog.com www.motor1.com www.webull.com {www.autoblog.com:3,www.motor1.com:2,www.webull.com:1}

如果它不是 Pandas df,我知道该怎么做。例如,如果我有这些键值列表:

keys = ['www.google.com','www.yahoo.com','www.ford.com']

values = [3,2,1]

我可以用 res_dict = dict(zip(keys,values)) 把它变成字典:{'www.google.com': 3,'www.yahoo.com': 2,'www.ford.com': 1}

但我想不出一种优雅的方式在 Pandas df 中执行此字典创建。有人可以帮我吗?

解决方法

一种方法是 apply 并使用 enumerate 来获取枚举:

df['rank_dict'] = (df.filter(like='rank_')
                     .apply(lambda x: {v:3-k for k,v in enumerate(x)},axis=1)
                  )

输出:

     id   date_created             rank_1           rank_2          rank_3                                          rank_dict
0  2223   3/3/21 3:26     www.google.com    www.yahoo.com     www.ford.com  {'www.google.com': 3,'www.yahoo.com': 2,'w...'
1  1112  2/25/21 1:35   www.autoblog.com   www.motor1.com   www.webull.com  {'www.autoblog.com': 3,'www.motor1.com': 2,...'

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...