问题描述
这是我正在研究的 data set 看起来像这样。
基本上,我想删除重复的行,我知道 drop_duplicate
命令,但我需要一些帮助。
让我通过对数据进行排序来向您展示,以便让您清楚地了解。
by_streamed=data.sort_values(by='Streams',ascending=False)
by_streamed
因此,当我获得前 10 首流媒体歌曲时,重复显然会干扰。如果你仔细观察,虽然这些歌曲的排名不同
data=data.drop_duplicates(subset=['Artist','Title'],keep='first')
但这会删除很多不应该存在的行。
subset
确实存在问题,但我无法解释。如果你能帮我弄清楚就太好了。提前致谢。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)