在放入 ALS 模型之前,我们是否需要对隐式数据进行标准化?如果是这样,如何?

问题描述

我正在使用隐式数据(零售交易数据 - 将购买的单位数量作为隐式数据)在 Pyspark 中创建 ALS 模型。

在将数据投入模型之前,我们是否需要对数据进行某种标准化/规范化? 如果不是,它如何处理商品超买或用户超买的情况。例如。牛奶的购买量通常比电视多,用户 1 的购买量通常比用户 2 少?

任何指针都会有所帮助。谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)