在土耳其语中找到金融新闻相似性的最佳方法?

问题描述

如您所知,财经新闻的句子大多由相同的词但不同的数字组成(例如,“欧元价格为 9.23 里拉”和“欧元价格为 8.46 里拉。”)。

我的目标是找到类似的财经新闻,并只选择其中之一放在新闻源上供我个人使用。我已经在互联网上搜索了最佳解决方案,但我最终得到了使用 tf-idf 的余弦相似度、Jaccard 相似度等解决方案。

当我看到一些 kaggle notebook 时,我找到了我的财经新闻的 BERT 嵌入,然后找到 BERT 嵌入之间的余弦相似度,以获得新闻之间的相似度。但我不确定这种方法是否足以满足我的目的。

是否有其他解决方案可以找到与上述示例中的财务报告或财经新闻相似的内容

而且,解释我如何使用 LSA 或 NER 创建有助于获得财务文本相似性的模型或函数真的很有帮助和信息量?

谢谢你的回答:)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)