根据人口统计和兴趣建议“ n”个用户的最佳方法

问题描述

我必须构建一个推荐引擎,向用户建议'n'个相似用户

我试图在用户-用户推荐系统方法和无监督的机器学习中实现这一点。 数据中没有噪音,即每个用户都很重要。

我尝试了两种方式:

1。最近的Neibhours:

model = NearestNeighbors(metric = 'cosine',algorithm = 'brute')
model.fit(X.to_numpy())
distances,indices = model.kneighbors(X.iloc[],n_neighbors = n)

这种方法可以立即为用户提供帮助,但是由于我们没有标记点,因此我无法找到评估该模型的方法

2。 HDBSCAN

model = hdbscan.HDBSCAN()
model.fit_predict(df)

在这方法中,我们得到了标签,但是要找到n个相似的用户,我们必须计算欧几里得距离和排序。如果我们尝试为新的点/用户触发,则必须重复此操作。

所需建议:

  1. 最适合这种情况的最近Neibhours或HDBSCAN
  2. 如何评估NearestNeibhours的性能和准确性
  3. 如果我们的查询点或用户在HDBSCAN中是一个离群值,怎么获得建议?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)