Apache Hivemall 介绍
Hivemall 是一个可扩展的机器学习算法工具,可在 Apache
Hive、Apache
Spark 和 Apache
Pig 上运行。
Hivemall 基于 Hive UDF,在工业实践应用中非常方便,方便数据科学家快速构建机器学习模型原型。
项目状态:目前为 Apache 孵化项目,支持列表如下:
-
Binary Classification Metrics
-
Multi-label Classification Metrics
-
Regression Metrics
-
Ranking Measures
-
Data Generation