问题描述
我有18万个熊猫系列,需要将它们组合成一个DataFrame。一个接一个地添加它们会花费很多时间,这显然是因为当数据帧的大小增加时,添加会变得越来越慢。即使我使用比Pandas更快的numpy,仍然存在相同的问题。
从系列创建DataFrame的更好方法是什么?
编辑:更多背景信息。系列存储在列表中。这是体育数据,该列表称为有18万多个项目的player_library。我没有意识到仅仅写就够了
pd.concat(player_library,axis=1)
而不是列出所有单个项目。现在,它可以快速而良好地工作。
解决方法
您可以尝试使用pd.concat
代替append
。
如果您希望每个系列都成为一列,那么
df = pd.concat([list_of_series_objects],axis=1)
要详细了解为什么迭代和附加操作昂贵,请阅读this question