问题描述
我正在使用隐式数据(零售交易数据 - 将购买的单位数量作为隐式数据)在 Pyspark 中创建 ALS 模型。
在将数据投入模型之前,我们是否需要对数据进行某种标准化/规范化?
如果不是,它如何处理商品超买或用户超买的情况。例如。牛奶的购买量通常比电视多,用户 1 的购买量通常比用户 2 少?
任何指针都会有所帮助。谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)