根据人口统计和兴趣建议“ n”个用户的最佳方法

问题描述

我必须构建一个推荐引擎，向用户建议'n'个相似用户。

我试图在用户-用户推荐系统方法和无监督的机器学习中实现这一点。数据中没有噪音，即每个用户都很重要。

我尝试了两种方式：

1。最近的Neibhours：

model = NearestNeighbors(metric = 'cosine',algorithm = 'brute')
model.fit(X.to_numpy())
distances,indices = model.kneighbors(X.iloc[],n_neighbors = n)

这种方法可以立即为用户提供帮助，但是由于我们没有标记点，因此我无法找到评估该模型的方法。

2。 HDBSCAN

model = hdbscan.HDBSCAN()
model.fit_predict(df)

在这种方法中，我们得到了标签，但是要找到n个相似的用户，我们必须计算欧几里得距离和排序。如果我们尝试为新的点/用户触发，则必须重复此操作。

所需建议：

最适合这种情况的最近Neibhours或HDBSCAN
如何评估NearestNeibhours的性能和准确性
如果我们的查询点或用户在HDBSCAN中是一个离群值，怎么获得建议？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

hdbscan hierarchical-clustering machine-learning nearest-neighbor recommendation-engine