我如何知道以 CSR 格式形成的 RCV1 数据集中的单词序列?

问题描述

我正在尝试复制一篇论文,Large-Scale Hierarchical Text Classification with Recursively Regularized Deep Graph-CNN,但我不知道如何以图表形式处理数据。

作者说他们使用滑动窗口对应来构建它,但是scikit-learn RCV1数据集没有保留顺序。所以我无法理解作者如何使用滑动窗口处理数据。

RCV1数据集还有另一种格式,保留顺序吗?

提供了代码on github,但是那部分是java编码的(之前没学过java),看不懂代码。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)