海量语料扫描查找相关信息供用户搜索的方法是什么

问题描述

我有一个包含大约 200 个文档的中等大小的文本语料库。我想构建一个搜索相关性应用程序，当用户查询某个信息时，系统应该扫描语料库并列出与搜索查询匹配的文档并具有置信度。我尝试使用 LDA 进行主题提取，并使用 scikitlearn 中的余弦查找相似性。但是我什至尝试过 BERT，但没有运气。在这种情况下，更好的方法/策略是什么？好心提醒。谢谢！

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）