问题描述
我正在尝试计算网站之间的相似度。是否有解决这个问题的 python 库和预训练模型?我的最终目标是预测访问某个网站的人是否会对产品感兴趣。例如,apple.com 和 abc.com 有多接近?我对访问 netflix.com 感兴趣的可能性有多大? 最终,我想对 url 进行词嵌入(但只有内容提供者,而不是访问的完整 url)。
解决方法
也许看看这些链接? :
https://importsem.com/use-google-nlp-to-compare-two-web-pages-entities-using-python/
https://stackoverflow.com/a/6259146/13264334
AFAIK,不存在用于此目的的预训练模型,尽管您可以研究迁移学习并使用其他一些预训练的“相似性”神经网络并在您的课程中训练最后一层。