如何获取德鲁伊段数据备份?

问题描述

我是德鲁伊的新手。在我们的应用程序中,我们将druid用于时间序列数据,这可能会很大(10-20TB)。 德鲁伊为您提供了深度存储的工具。但是,如果此深层存储崩溃/或无法访问,则将导致数据丢失,进而影响应用程序正在运行的分析。 我正在考虑将增量备份Druid段数据带到ftp服务器等某个安全位置。因此,如果深层存储不可用,则他们可以从此ftp服务器恢复数据。

德鲁伊中是否有可用的工具/工具来增量备份/还原德鲁伊段?

解决方法

通常,定期拍摄元数据存储的快照非常重要,因为这是深度存储中内容的“索引”。也许每天一张快照,然后将其存储任意长时间。最好将它们存储至少两周,以防万一您出于某种原因需要回滚。

当新段出现时,您还需要备份它们。取得一致的快照并不重要,只是为了最终获得每个文件。

另请参见https://groups.google.com/g/druid-user/c/itfKT5vaDl8

您提到的另一条记录是数据丢失:Deep Storage是不是直接查询的-例如,在Historical过程中,查询是在本地段缓存上执行的。 Deep Storage是在摄取时写入的,因此您可能会“丢失”一旦再次可用就无法摄取的数据,但是由于已加载的数据在历史记录中,因此您将继续获得分析功能……一个想法哈哈!

希望对您有帮助。...?!?!