如何恢复 hdfs 删除的文件

问题描述

我被问到以下问题。

采访者:如何在 hdfs 中恢复已删除文件。 我:我们可以从垃圾目录复制/移回原始目录。 采访者:除了垃圾回收,还有别的办法吗? 我:我说不。

所以我的问题是,是否真的有任何方法可以恢复已删除文件或面试官只是要求我测试我的信心。

我发现以下恢复方法与 hdfs -cp/mv 不同,但它也从垃圾箱中获取文件

hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true -D dfs.checksum.tpe=CRC32C -m 10 -pb -update /users/vijay/.Trash/ /application/data /vijay;

解决方法

Hadoop从2.1.0版本开始提供HDFS快照(SnapShot)功能 你可以试试用

首先,创建快照

hdfs dfsadmin -allowSnapshot /user/hdfs/important
hdfs dfs -createSnapshot /user/hdfs/important important-snapshot

接下来,尝试删除一个文件

hdfs dfs -rm -r /user/hdfs/important/important-file.txt

最后,恢复它

hdfs dfs -ls /user/hdfs/important/.snapshot/
hdfs dfs -cp /user/hdfs/important/.snapshot/important-snapshot/important-file.txt /user/hdfs/important/
hdfs dfs -cat /user/hdfs/important/important-file.txt

P.S:这样恢复被删除的文件必须使用CP命令(不是MV命令),因为快照中删除的文件是只读文件

希望我的回答能帮到你

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...