问题描述
我需要你的帮助来理解 Nagios 中的以下指令时序。
check_interval
retry_interval
max_check_attempts
notification_interval
notification_options
根据时间安排,我收到的电子邮件通知不正确;正如您在以下屏幕截图中看到的那样,它不是恒定的:
这让我很困惑。
我在 Nagios 服务重启后下午 4:11 收到的第一个通知,后来你可以看到没有固定的时间间隔。
我的示例 node.cfg:
define host {
use linux-server
host_name Linux_Slave
alias Linux_Slave
check_period 24x7
check_command check-host-alive
check_interval 4
retry_interval 1
max_check_attempts 3
notification_period 24x7
notification_options d
notification_interval 5
contact_groups admins
address x.x.x.x
}
感谢你们中的任何人能帮助我。
解决方法
如果服务在两次通知之间的时间内再次起跳,则您附加的电子邮件摘录不可见,这可能有助于了解 Nagios 采取的行动。
您能否检查您的 Nagios 日志以获取导致通知的精确事件链?
电子邮件以正确的时间段发送,因为您设置了 notification_interval 5
,即 16:27 之后的邮件(如预期的 5 分钟后)在 16:32 发送第二封邮件,同样适用于来自 16:47 和 16:52 的邮件。
从技术上讲,当发生触发电子邮件的事件时(在 3 次检查尝试失败后),您将收到第一个通知,然后每 5 分钟收到一封新邮件,而主机/服务后的检查处于硬状态再次安排正常检查时间。
有关检查时间的一些信息也可以在以下位置找到:https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/checkscheduling.html