如何测试哪种文档相似度算法性能最好

问题描述

我想构建一个文档相似度算法,目前我正在探索将我的文本转换为词向量的不同方法——TF-IDF、WORD2VEC、glove、BERT 等,此后我使用余弦相似度来衡量各种文档之间的相似度向量。

有什么方法可以测试哪些词嵌入最适合我的情况?我已经通过查看文档内容用肉眼测试了一些案例,但是否有更好的方法来在更大范围内比较这些案例?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)