将pandas数据框的值与字典键进行比较,然后将该字典中的值插入新列中

问题描述

相对较新的python / pandas用户。我在A列中有一个包含数千个值的数据框,索引到Account_num。

ID_num  A
A300    37
B400    82
T500    10
...     ...

另一个数据框在M列中有大约300个值。第N列中的每个值都在第一个数据帧的A列中显示,每百/千次。对于每个值,都有一个平均值,中位数和众数。

M   Mean  Median  Mode
99  2.3   7.0     9.9
37  3.6   6.6     0.2
10  4.1   4.2     8.1
82  1.9   7.7     5.0
... ...   ...     ...

我正在寻找的输出将是这样的:

ID_num  A   Mean  Median  Mode
A300    37  3.6   6.6     0.2
B400    82  1.9   7.7     5.0
T500    10  4.1   4.2     8.1
...     ... ...   ...     ...

到目前为止,我的研究已将我指向.map函数,在该函数中,我将第二个表(M)转换为字典,然后将其映射到第一个表中的列。但是,我很难理解它的工作原理以及为确保正确的值进入正确的列而需要编写的内容。我还没有为此写出完整的if语句...但是我不确定那一开始是否是正确的方向。

任何想法或研究领域将不胜感激!

解决方法

该线程可能有助于您进一步了解map函数: Using python map and other functional tools

但是对于您的特定问题,merge可能是更整洁的选择。

import pandas as pd 

df1 = pd.DataFrame({'ID_num': ['A300','B400','T500'],'A': [37,82,10]})
df2 = pd.DataFrame({'M': [99,37,10,82],'Mean': [2.3,3.6,4.1,1.9],'Median': [7.0,6.6,4.2,7.7],'Mode': [9.9,0.2,8.1,5.0]})


pd.merge(df1,df2,how='left',left_on='A',right_on='M').drop('M',axis=1)

输出:

  ID_num   A  Mean  Median  Mode
0   A300  37   3.6     6.6   0.2
1   B400  82   1.9     7.7   5.0
2   T500  10   4.1     4.2   8.1

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...