如何评估基于知识的推荐系统?

问题描述

我创建了一种算法,可以根据链接的开放数据云中找到的关系推荐与特定电影相关的电影,例如与《终结者》电影相关的电影。它提取在 LinkedMDB 数据集中找到的关系来推荐相似的电影,并根据不同的相似度算法依赖电影名称间的相似度。因此,该算法生成了如下电影列表(推荐电影)。 ...

  http://dbpedia.org/resource/Terminator_2:_Judgment_Day
  http://dbpedia.org/resource/The_Abyss
  http://dbpedia.org/resource/True_Lies
  http://dbpedia.org/resource/Platoon
  http://dbpedia.org/resource/Aliens
  http://dbpedia.org/resource/Escape_from_New_York
  http://dbpedia.org/resource/Hardware_Wars
  http://dbpedia.org/resource/No_Escape
  http://dbpedia.org/resource/The_6th_Day
  http://dbpedia.org/resource/The_Crazies

... 现在我需要评估这些结果并与其他研究进行比较。与初始电影(终结者)相似和相关的前 10 部电影将作为推荐项目展示给用户,该算法是一种基于知识的算法,它不同于依赖评级的协同过滤算法。因此,此任务称为排名任务。 Precision 将非常小,大约只有 0.20 和 Recall 0.01,这件事很有意义,因为我的数据只有 10,它将与 MovieLens 中存在的数千条记录进行比较。我不知道在这种情况下我应该怎么做来评估我的结果,因为我的算法不依赖于评级,我可以像传统算法一样预测未知评级并将其与已知评级进行比较。那么我应该怎么做来评估我的结果呢? 除此之外,我的算法根据初始电影及其特征进行个性化,例如演员和导演的姓名以及用户可能喜欢的其他一些数据。因此,我过滤了 MovieLens 以包含对初始电影(The Terminator)进行评分的所有用户,以查看是否同一用户也对我的算法生成的 10 部电影给出了高评分,但我也得到了低精度。 我阅读了一些使用交叉验证并将电影镜头拆分为训练和测试的论文,但算法没有数据的数值表示来训练我的模型。它通过 SPARQL 处理 Linked 开放数据并推荐相关电影。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...