如何在python pandas中合并两个数据框之前估算值,以避免数据丢失

问题描述

我有两个数据帧df1df2,如下所示:

df1

      name  posteam   down      rush
0   A.Ekeler    LAC   1.0       35.7
1   A.Ekeler    LAC   2.0       15.1
2   A.Ekeler    LAC   3.0       15.9
3   A.Ekeler    LAC   4.0       0.4
4   A.Jones     GB    1.0       105.1
5   A.Jones     GB    2.0       79.2
6   A.Jones     GB    3.0       8.1
7   A.Jones     GB    4.0       1.0
df2

    name      posteam   down    passes
0   A.Ekeler    LAC     1.0     122.8
1   A.Ekeler    LAC     2.0     63.2
2   A.Ekeler    LAC     3.0     39.0
3   A.Ekeler    LAC     4.0     -1.0
4   A.Jones     GB      1.0     43.7
5   A.Jones     GB      2.0     52.0
6   A.Jones     GB      3.0     10.4

我想将它们合并到nameposteamdown行中。但是,name下的某些值在down == 4中有df1的数据,但没有df2的数据(请看A.Jones。一个df有 down == 4数据,另一个没有)。合并时,由于我要与down合并,因此down == 4上的值会消失,就像这样:

merged = pd.merge(df1,df2,on=['name','posteam','down'])

    name       posteam  down    rush    passes
0   A.Ekeler    LAC     1.0     35.7    122.8
1   A.Ekeler    LAC     2.0     15.1    63.2
2   A.Ekeler    LAC     3.0     15.9    39.0
3   A.Ekeler    LAC     4.0     0.4     -1.0
4   A.Jones     GB      1.0     105.1   43.7
5   A.Jones     GB      2.0     79.2    52.0
6   A.Jones     GB      3.0     8.1     10.4

玩家A.Jonesdown == 4中有df1的数据,但没有df2中的数据。我该如何为其中一个df中没有数据的播放器估算一个0,以使它们在合并时不会消失?像这样(请看索引7):

df2

    name      posteam   down    passes
0   A.Ekeler    LAC     1.0     122.8
1   A.Ekeler    LAC     2.0     63.2
2   A.Ekeler    LAC     3.0     39.0
3   A.Ekeler    LAC     4.0     -1.0
4   A.Jones     GB      1.0     43.7
5   A.Jones     GB      2.0     52.0
6   A.Jones     GB      3.0     10.4
7   A.Jones     GB      4.0     0.0

因此,当我合并时,我将保留down == 4中的df1数据,就像这样(请看索引7):

merged = pd.merge(df1,'posteam,'down])

    name       posteam  down    rush    passes
0   A.Ekeler    LAC     1.0     35.7    122.8
1   A.Ekeler    LAC     2.0     15.1    63.2
2   A.Ekeler    LAC     3.0     15.9    39.0
3   A.Ekeler    LAC     4.0     0.4     -1.0
4   A.Jones     GB      1.0     105.1   43.7
5   A.Jones     GB      2.0     79.2    52.0
6   A.Jones     GB      3.0     8.1     10.4
7   A.Jones     GB      4.0     1.0     0.0

我尝试将down从合并中删除,但这使一切搞砸了

解决方法

您应该尝试

merged_df = pd.merge(df1,df2,how='outer',on=['name','posteam','down']).fillna(value=0.0)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...