问题描述
我有一个包含大约 200 个文档的中等大小的文本语料库。我想构建一个搜索相关性应用程序,当用户查询某个信息时,系统应该扫描语料库并列出与搜索查询匹配的文档并具有置信度。我尝试使用 LDA 进行主题提取,并使用 scikitlearn 中的余弦查找相似性。但是我什至尝试过 BERT,但没有运气。
在这种情况下,更好的方法/策略是什么?好心提醒。谢谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)