文字中最常见的n个字

问题描述

我目前正在学习与NLP合作。我面临的问题之一是在文本中找到最常见的n个单词。请考虑以下内容:

text = ['狮子猴象杂草','虎象狮子水草','狮子杂草马可夫大象猴精','守卫象草财富狼']

假设n =2。我不是在寻找最常见的二元组。我正在搜索文本中出现最多的2个单词。像这样,上面的输出应为:

“狮子”和“大象”:3 '大象'和'杂草':3 '狮子'和'猴子':2 “大象”和“猴子”:2

等等。

有人可以提出解决这个问题的合适方法吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)