如何计算hadoop中使用的df?

问题描述

我有一个简单的问题。 hadoop UI中使用的dfs约为3TB,但我的hdfs中有1.4TB数据。 由于复制3,使用的dfs是数据使用率* 3吗? 谢谢

解决方法

Namenode UI上的DFS使用率=所有数据节点上的群集上已使用的总空间。

如果复制因子为2,则它将为“一个数据节点上的数据* 2”

您可以使用以下命令检查DFS在群集上的总体使用情况和单独使用情况-

hdfs dfsadmin -report