是否有Python代码从文档术语矩阵中删除低熵词?

问题描述

我正在建立一个假新闻分类器。

我有一个典型的文档术语矩阵,其中文档作为字符串,单词作为列。

我想计算每个单词的熵并绘制熵的分布,以便确定一个截止值并从矩阵中删除熵低的单词。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)