问题描述
我有一个数据框“ df1”,其中包含三列:“名称”,“年龄”和“数字”以及数百行。我想创建两个新的数据框:“ df2”表示具有最高的五个“年龄”值的“名称”行,而“ df3”表示具有最高的五个“数字”值的“名称”行。我正在考虑做一些.sort()或.max()函数,但我不太确定。有人可以帮我吗?预先感谢!
解决方法
您可以使用熊猫nlargest
函数,如下所示:
df2 = df.nlargest(5,'Age')
df3 = df.nlargest(5,'Number')
只需确保列为数字类型即可。