在 Python 中从 Dataframe 创建文档术语矩阵

问题描述

我想创建一个词条矩阵文档,根据标签确定一组词的关键词。

我的数据集看起来像这样。

  id   |                     description                                      |   severity  |
-------------------------------------------------------------------------------------------
10020  |    remotely deleting file opened editor                              | major       |
10021  |    setting editor color setting string requires application restart  | minor       |
100210 |    ant build files cleared platform restart                          | major       |

我想创建一个看起来像这样的术语矩阵文档。

        | major | minor |
------------------------
editor  |   1   |   1   |
restart |   1   |   1   |

1 是单词的频率,但我想用 tfidf 权重填充它。 有人有什么想法吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)