我如何根据它们在被收藏的推文中出现的次数绘制单词?

问题描述

我想绘制我的推特数据,看看哪些是与被收藏超过 10 次的推文相关的最常见词。

我已经下载了我的推特数据,对数据框进行了排序,从推文中删除了停用词。我猜最喜欢的计数应该在 x 轴上,但我不知道如何做以下两件事:

  1. 分解每条推文,使每条推文中的词都有频率(我认为这是必要的)
  2. 根据它们在最受欢迎的推文中出现的情况绘制单词。 有什么想法吗?

谢谢。

编辑:我使用集合和 itertool 获得了推文子集中每个单词的频率。对第 2 步有什么想法吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)