如何使用 Python 在网站网址之间创建相似性

问题描述

我正在尝试计算网站之间的相似度。是否有解决这个问题的 python 库和预训练模型?我的最终目标是预测访问某个网站的人是否会对产品感兴趣。例如,apple.com 和 abc.com 有多接近?我对访问 netflix.com 感兴趣的可能性有多大? 最终,我想对 url 进行词嵌入(但只有内容提供者,而不是访问的完整 url)。

解决方法

也许看看这些链接? :

https://importsem.com/use-google-nlp-to-compare-two-web-pages-entities-using-python/

https://stackoverflow.com/a/6259146/13264334

AFAIK,不存在用于此目的的预训练模型,尽管您可以研究迁移学习并使用其他一些预训练的“相似性”神经网络并在您的课程中训练最后一层。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...