计算熊猫文本列中最常见的短语

问题描述

我有一个带有文本列的pandas数据框,每个记录有50个短语,每个记录用“ |”分隔我想计算整个数据中的前50个词组。例如,考虑数据中的“文本”列,每行中有4个词组,并用管道分隔。 (实际数据有50个词组)。管道前后的空间。

                                        text
       0    "Andy | max min | tea | pal"
       1    "no limit | toy 2011 | hess | mix"
       2    "Andy | Andy | toy 2011| pal"

如何找到前n个功能?例如,在上面,前3个短语是:

 Andy       3
 toy 2011   2
 pal        2

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)