需要帮助理解 Nagios check_interval retry_interval max_check_attempts notification_interval notification_options

问题描述

我需要你的帮助来理解 Nagios 中的以下指令时序。

check_interval  
retry_interval  
max_check_attempts  
notification_interval  
notification_options

根据时间安排,我收到的电子邮件通知不正确;正如您在以下屏幕截图中看到的那样,它不是恒定的:

这让我很困惑。

我在 Nagios 服务重启后下午 4:11 收到的第一个通知,后来你可以看到没有固定的时间间隔。

  • 问题 1:如何设置每隔 10 分钟发送一次电子邮件通知

  • 问题 2:我应该在什么时间间隔收到配置关闭的电子邮件

我的示例 node.cfg:

define host {

    use                     linux-server            
    host_name               Linux_Slave
    alias                   Linux_Slave
    check_period            24x7
    check_command           check-host-alive
    check_interval          4
    retry_interval          1
    max_check_attempts      3
    notification_period     24x7
    notification_options    d
    notification_interval   5
    contact_groups          admins
    address                 x.x.x.x
}

感谢你们中的任何人能帮助我。

解决方法

如果服务在两次通知之间的时间内再次起跳,则您附加的电子邮件摘录不可见,这可能有助于了解 Nagios 采取的行动。

您能否检查您的 Nagios 日志以获取导致通知的精确事件链?

电子邮件以正确的时间段发送,因为您设置了 notification_interval 5,即 16:27 之后的邮件(如预期的 5 分钟后)在 16:32 发送第二封邮件,同样适用于来自 16:47 和 16:52 的邮件。

从技术上讲,当发生触发电子邮件的事件时(在 3 次检查尝试失败后),您将收到第一个通知,然后每 5 分钟收到一封新邮件,而主机/服务后的检查处于硬状态再次安排正常检查时间。

有关检查时间的一些信息也可以在以下位置找到:https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/checkscheduling.html