海量语料扫描查找相关信息供用户搜索的方法是什么

问题描述

我有一个包含大约 200 个文档的中等大小的文本语料库。我想构建一个搜索相关性应用程序,当用户查询某个信息时,系统应该扫描语料库并列出与搜索查询匹配的文档并具有置信度。我尝试使用 LDA 进行主题提取,并使用 scikitlearn 中的余弦查找相似性。但是我什至尝试过 BERT,但没有运气。 在这种情况下,更好的方法/策略是什么?好心提醒。谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)