问题描述
背景:我有一个简单的(2 个节点)弹性云部署,有 3 个主要索引,这些索引保存了我用于索引和搜索的大部分数据。这些索引中最大的一个是 ~250GB(我们将其称为 example-index
),4/1 分片方案产生 8 个分片。我设置了一个简单的监控警报,在索引分片超过 50GB 的推荐大小时触发。
问题:在我的集群监控中,我看到了 large shard size
警报。警报设置为每 12 小时通知一次,但每分钟检查一次。它还声称被识别为太大的分片约为 133GB,并且来自 example-index
。实际警报是这样的:
The following index: example-index has a large shard size of: 132.99GB at April 15,2021 11:51 AM EDT
故障排除完成:我使用开发工具手动对索引分片运行 cat
查询,并确认每个查询都在 30GB 左右徘徊。查询中列出的 example-index
中的任何分片都没有返回高于 31GB - 完全在合理容差范围内。
问题:大致是标题。我如何才能对这种类型的警报进行故障排除?是否存在我未发现或未发现的此警报的任何潜在潜在原因?或者这只是一个错误?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)