问题描述
我想知道是否已确认任何 Mahout 版本可以与任何版本的 Hadoop 3.x 一起正常工作。 看起来 Cloudera 和 Amazon 的 Hadoop 发行版在从 Hadoop 2 到 Hadoop 3 时都删除了 Mahout。但我找不到任何省略 Mahout 的理由。
是否有人拥有表明 Mahout 可以与 Hadoop 3 配合使用的来源或个人经验?
解决方法
Mahout的trunk分支在git hub上推荐的hadoop版本是hadoop-2.4.1
但是看看 maser 分支上的这个 dockerfile: https://github.com/apache/mahout/blob/master/docker/build/Dockerfile
它在 hadoop 3.0 上使用 spark v2.3.1 gettyimages/spark:2.3.1-hadoop-3.0
希望能帮到你