使用pyspark进行ANOVA计算

问题描述

我没有在网上进行搜索,但是pyspark中是否存在可以执行ANOVA和Tukeys HSD的功能或库?还是我必须从头开始编写代码

解决方法

您可以在 PySpark 中使用 SciPy 包进行方差分析,例如one-way ANOVA, 以及 PySpark 中的 statsmodels package for Tukey HSD