问题描述
相对较新的python / pandas用户。我在A列中有一个包含数千个值的数据框,索引到Account_num。
ID_num A
A300 37
B400 82
T500 10
... ...
另一个数据框在M列中有大约300个值。第N列中的每个值都在第一个数据帧的A列中显示,每百/千次。对于每个值,都有一个平均值,中位数和众数。
M Mean Median Mode
99 2.3 7.0 9.9
37 3.6 6.6 0.2
10 4.1 4.2 8.1
82 1.9 7.7 5.0
... ... ... ...
我正在寻找的输出将是这样的:
ID_num A Mean Median Mode
A300 37 3.6 6.6 0.2
B400 82 1.9 7.7 5.0
T500 10 4.1 4.2 8.1
... ... ... ... ...
到目前为止,我的研究已将我指向.map函数,在该函数中,我将第二个表(M)转换为字典,然后将其映射到第一个表中的列。但是,我很难理解它的工作原理以及为确保正确的值进入正确的列而需要编写的内容。我还没有为此写出完整的if语句...但是我不确定那一开始是否是正确的方向。
任何想法或研究领域将不胜感激!
解决方法
该线程可能有助于您进一步了解map
函数:
Using python map and other functional tools
但是对于您的特定问题,merge
可能是更整洁的选择。
import pandas as pd
df1 = pd.DataFrame({'ID_num': ['A300','B400','T500'],'A': [37,82,10]})
df2 = pd.DataFrame({'M': [99,37,10,82],'Mean': [2.3,3.6,4.1,1.9],'Median': [7.0,6.6,4.2,7.7],'Mode': [9.9,0.2,8.1,5.0]})
pd.merge(df1,df2,how='left',left_on='A',right_on='M').drop('M',axis=1)
输出:
ID_num A Mean Median Mode
0 A300 37 3.6 6.6 0.2
1 B400 82 1.9 7.7 5.0
2 T500 10 4.1 4.2 8.1