hadoop – 如何在没有DNS的情况下运行HDFS集群

我正在构建一个本地HDFS开发环境(实际上是hadoop mesos zk kafka),以简化Spark作业的开发并促进本地集成测试.
所有其他组件都运行正常,但我遇到了HDFS问题.当数据节点尝试连接到名称节点时,我得到一个DisallowedDataNodeException:

org.apache.hadoop.hdfs.server.protocol.DisallowedDatanodeException: Datanode denied communication with namenode

与同一问题相关的大多数问题归结为名称节点上的数据节点的名称解析,或者通过etc / hosts文件或使用dns进行静态解析.静态解析不是docker的选项,因为我不知道创建名称节点容器时的数据节点.我想避免创建和维护其他DNS服务.理想情况下,我想使用docker的–link功能连接所有内容.

有没有办法以这样的方式配置HDFS,它只使用IP地址工作?

我发现这个属性并设置为false,但它没有做到这一点:

dfs.namenode.datanode.registration.ip-hostname-check(默认值:true)

有没有办法让多节点本地HDFS集群只使用IP地址而不使用DNS?

最佳答案
我会考虑重新配置你的Docker镜像以使用不同的主机文件[1].特别是:

>在Dockerfile中,执行switch-a-roo [1]
>打开主节点
>打开链接的数据节点
>在启动datanode之前,将/ etc / hosts复制到新位置/ tmp / hosts
>将主节点的名称和主节点ip附加到新的hosts文件

希望这对你有用!

[1] https://github.com/dotcloud/docker/issues/2267#issuecomment-40364340

相关文章

最近一直在开发Apworks框架的案例代码,同时也在一起修复Apw...
最近每天都在空闲时间努力编写Apworks框架的案例代码WeText。...
在《Kubernetes中分布式存储Rook-Ceph部署快速演练》文章中,...
最近在项目中有涉及到Kubernetes的分布式存储部分的内容,也...
CentOS下Docker与.netcore(一) 之 安装 CentOS下Docker与.ne...
CentOS下Docker与.netcore(一) 之 安装 CentOS下Docker与.ne...