MMLSpark 用于 Apache Spark 的深度学习库

程序名称:MMLSpark

授权协议: MIT

操作系统: 跨平台

开发语言: Scala

MMLSpark 介绍

MMLSpark ,即 Microsoft Machine Learning for Apache Spark ,是微软开源的一个针对 Apache
Spark

的深度学习和数据可学工具,为大型映像和文本数据库快速创建强大、可缩放性能优越的预测和分析模型。

MMLSpark 可与 Microsoft Cognitive Toolkit
(CNTK,微软认知工具包)

OpenCV (计算机视觉库)无缝集成,允许:

  • 流入和预处理图像数据

  • 使用预先定型的深度学习模型特征化图像和文本

  • 使用隐式特征化对分类和回归模型进行定型和评分

示例:

...
import mmlspark
# Initialize cntkModel and define input and output columns
cntkModel = mmlspark.cntkModel() \
                    .setInputCol("images").setoutputCol("output") \
                    .setModelLocation(modelFile)
# Train on dataset with internal spark pipeline
scoredImages = cntkModel.transform(imagesWithLabels)
...

MMLSpark 官网

https://github.com/Azure/mmlspark

相关编程语言

欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模...
Salad 是一种有效且灵活的实现著名的异常检测方法回...
multilanguage 是一个多语开发工具包,用于缓存多语...
go-cortex 是一个服务,通过倾听你的句子,并视图理...
DKPro Core 是基于 Apache UIMA 框架之上的自然语言...
NLTK 会被自然地看作是具有栈结构的一系列层,这些层...