如何将大量熊猫系列组合到DataFrame中?

问题描述

我有18万个熊猫系列,需要将它们组合成一个DataFrame。一个一个添加它们会花费很多时间,这显然是因为当数据帧的大小增加时,添加会变得越来越慢。即使我使用比Pandas更快的numpy,仍然存在相同的问题。

从系列创建DataFrame的更好方法是什么?

编辑:更多背景信息。系列存储在列表中。这是体育数据,该列表称为有18万多个项目的player_library。我没有意识到仅仅写就够了

pd.concat(player_library,axis=1) 

而不是列出所有单个项目。现在,它可以快速而良好地工作。

解决方法

您可以尝试使用pd.concat代替append

如果您希望每个系列都成为一列,那么

df = pd.concat([list_of_series_objects],axis=1)

要详细了解为什么迭代和附加操作昂贵,请阅读this question