如何处理“重新索引仅对唯一值的索引对象有效”

问题描述

我有一个名称数据框 (df):

df:

  Group  Name
0     A   jim
1     B   bob
2     C   joe
3     A  jane
4     C   doe

还有一个调度数据框 (df1):

df1:

      Group     Due_Date      Assignment
0     A         1-19 17:00    Quiz #1 A
1     B         1-21 16:30    Quiz #1 A
2     C         1-21 16:30    Quiz #1 A
5     A         1-24 11:30    Exam A
6     B         1-24 11:30    Exam A
7     C         1-24 12:30    Exam A

我旋转 df1 (df1_pivoted) 以将分配放在 df1 列中:

df1 = df1.pivot(index='Group',columns='Assignment',values='Due_Date')
df1_pivoted:

Assignment      Exam A   Quiz #1 A
Group
A           1-24 11:30  1-19 17:00
B           1-24 11:30  1-21 16:30
C           1-24 12:30  1-21 16:30

然后我尝试重新添加名称,但我不知道如何处理“重新索引仅对具有唯一值的索引对象有效”错误。我认为这是因为某些名称与多个组相关联:

d=df.set_index('Group')['Name']
p='({})'.format('\\b|\\b'.join(df['Group']))
df3['Name']=df3['Group'].str.extract(p,expand=False).map(d)

导致错误:“重新索引仅对唯一值的索引对象有效”

我希望返回的最终数据帧 (df1_final) 如下所示:

df1_final:
Group   Name    Exam A      Quiz #1 A
A       jim     1-24 11:30  1-19 17:00
B       bob     1-24 11:30  1-21 16:30
C       joe     1-24 12:30  1-21 16:30
A       jane    1-24 11:30  1-19 17:00
C       doe     1-24 12:30  1-21 16:30

如果有更 Pythonic 的方法来解决这个问题,我绝对愿意学习更简洁的编程。谢谢您的帮助。这个社区真的很棒。去年我刚开始将编程作为一种爱好,让工作更轻松/更有趣,我不知道如果没有你们所有人和你们愿意提供帮助,我是否会坚持下去。再次感谢

解决方法

问题是pandas 不知道如何处理直接赋值,因为A 和C 有多个值。改用左连接来使其工作。 您的示例已损坏(缺少要重现的部分),因此想象一下 df1_pivoted 是您的旋转 df1,而 df3 的创建看起来像

df3:
Group   Name  
A       jim 
B       bob
C       joe
A       jane 
C       doe

那么下面应该做的工作

df3.set_index('Group',inplace=True)
df1_pivoted = df1_pivoted.join(df3,how='left')

或者,您可以重置索引,并对 Group 列进行合并以获得相同的效果。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...