问题描述
我有一个 Pandas 数据框,其中包含 id
、date_created
、rank_1
、rank_2
、rank_3
列。下面显示了数据框的 2 行。
id | 创建日期 | rank_1 | rank_2 | rank_3 |
---|---|---|---|---|
2223 | 3/3/21 3:26 | www.google.com | www.yahoo.com | www.ford.com |
1112 | 2/25/21 1:35 | www.autoblog.com | www.motor1.com | www.webull.com |
我正在尝试为此 df 分配一个新列并将其命名为 rank_dict
,这会将数字 3 分配给 rank_1 URL,将数字 2 分配给 rank_2 URL,将数字 1 分配给 rank_3 URL。
所以理想的结果应该是这样的:
id | 创建日期 | rank_1 | rank_2 | rank_3 | rank_dict |
---|---|---|---|---|---|
2223 | 3/3/21 3:26 | www.google.com | www.yahoo.com | www.ford.com | {www.google.com:3,www.yahoo.com:2,www.ford.com:1} |
1112 | 2/25/21 1:35 | www.autoblog.com | www.motor1.com | www.webull.com | {www.autoblog.com:3,www.motor1.com:2,www.webull.com:1} |
如果它不是 Pandas df,我知道该怎么做。例如,如果我有这些键值列表:
keys = ['www.google.com','www.yahoo.com','www.ford.com']
values = [3,2,1]
我可以用 res_dict = dict(zip(keys,values))
把它变成字典:{'www.google.com': 3,'www.yahoo.com': 2,'www.ford.com': 1}
。
但我想不出一种优雅的方式在 Pandas df 中执行此字典创建。有人可以帮我吗?
解决方法
一种方法是 apply
并使用 enumerate
来获取枚举:
df['rank_dict'] = (df.filter(like='rank_')
.apply(lambda x: {v:3-k for k,v in enumerate(x)},axis=1)
)
输出:
id date_created rank_1 rank_2 rank_3 rank_dict
0 2223 3/3/21 3:26 www.google.com www.yahoo.com www.ford.com {'www.google.com': 3,'www.yahoo.com': 2,'w...'
1 1112 2/25/21 1:35 www.autoblog.com www.motor1.com www.webull.com {'www.autoblog.com': 3,'www.motor1.com': 2,...'