当所有分片都约为 30GB 时，我该如何排查弹性“大分片大小”警报？

问题描述

背景：我有一个简单的（2 个节点）弹性云部署，有 3 个主要索引，这些索引保存了我用于索引和搜索的大部分数据。这些索引中最大的一个是 ~250GB（我们将其称为 example-index），4/1 分片方案产生 8 个分片。我设置了一个简单的监控警报，在索引分片超过 50GB 的推荐大小时触发。

问题：在我的集群监控中，我看到了 large shard size 警报。警报设置为每 12 小时通知一次，但每分钟检查一次。它还声称被识别为太大的分片约为 133GB，并且来自 example-index。实际警报是这样的：

The following index: example-index has a large shard size of: 132.99GB at April 15,2021 11:51 AM EDT

故障排除完成：我使用开发工具手动对索引分片运行 cat 查询，并确认每个查询都在 30GB 左右徘徊。查询中列出的 example-index 中的任何分片都没有返回高于 31GB - 完全在合理容差范围内。

问题：大致是标题。我如何才能对这种类型的警报进行故障排除？是否存在我未发现或未发现的此警报的任何潜在潜在原因？或者这只是一个错误？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

elastic-stack elasticsearch elasticsearch kibana observability

当所有分片都约为 30GB 时，我该如何排查弹性“大分片大小”警报？

问题描述

解决方法

相关问答