CEPH PG 数据恢复/PG 关闭

问题描述

我有一个用于池的 2 节点 CEPH 集群。

数据处于2副本模式。

关闭一个节点进行维护,而另一个节点正在工作。

后来断电导致第二个节点重新启动,但问题是它启用了 RAID 卡缓存并且电池性能下降导致缓存丢失。

后来,一旦我们清除了回写缓存​​,就会出现相同的节点。现在 Pool 根本无法使用,因为它由于缓存清除而丢失了一些数据。

然后我们启动了第一个我们为了维护而删除的节点,现在当这个节点出现时,很少有 pgs 成为 recovery_unfound,我后来将 pgs mark_unfound_lost 标记删除。这清除了错误,但所有 PG 现在都进入关闭状态。

除此之外,只有一个节点的 OSD 保持运行状态,因为当我尝试在任何节点中启动其他 OSD 时。其他节点的 OSD 自动关闭

现在,在我们关闭一个节点进行维护之后丢失数据我没问题。

但我所期望的只是启动池,以便我至少可以从第一个节点获取数据。

我尝试通过保险丝安装 ceph bluestores 并尝试使用存在的 pg 数据恢复数据,但仍然没有运气,因为我不知道在哪里可以找到 RBD 图像哈希 ID。

任何帮助将不胜感激。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)