二阶统计分析或寻找混杂因素数据科学

问题描述

我一直在尝试在 Python 中复制使用 Einstein discovery 完成的统计分析。

Einstein discovery 是一个基于人工智能的平台,可根据上传的数据集提供统计见解。

我使用了超市数据集。

一开始,爱因斯坦的发现是做岭回归分析,找出R2值最大的变量。

例如,在本例中,它发现子类别解释了销售额的大部分变化。

在子类别中,复印机和机器的表现非常好,并且具有统计学意义。

但是,机器做得很好,尤其是当折扣在 0-0.05 之间时。

有人做过这种分析吗? 任何帮助表示赞赏。

Einstein Discovery story

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)