使用Sensu在一定时间范围内多次检查失败时将检查标记为警告或错误

88次阅读
没有评论

问题描述

在使用Sensu时遇到一个问题,需要在某个时间范围内对某个检查进行多次检查,然后在用户得到通知之前标记为警告或错误。用户已经查阅了多个Sensu属性的配置文档,但没有找到解决方案。用户想知道是否有可能在一定时间范围内多次检查失败时将检查标记为警告或错误。此外,用户还提到了可能使用聚合(aggregates)的选项,但不确定是应该将其用于一个检查还是多个客户端。

解决方案

请注意以下操作注意版本差异及修改前做好备份。
用户可以使用Sensu的occurrences过滤器来实现在一定时间范围内多次检查失败时将检查标记为警告或错误。以下是具体步骤:

步骤1:应用过滤器到处理程序

在Sensu配置中,首先将occurrences过滤器应用到相应的处理程序(handler)中。这将使处理程序在满足一定次数的检查失败后才会触发。例如,在处理程序定义中添加"filters": ["occurrences"],如下所示:

{
  "handlers": {
    "email": {
      "...": "...",
      "filters": ["occurrences"]
    }
  }
}

步骤2:在检查中使用occurrences属性

在需要进行多次检查的特定检查定义中,使用occurrences属性来设置检查失败的触发次数。只有在连续失败了指定次数的检查后,处理程序才会被触发。例如:

{
  "checks": {
    "check-http": {
      "...": "...",
      "occurrences": 2
    }
  }
}

在上面的示例中,occurrences属性被设置为2,表示只有在检查连续失败了两次后,处理程序才会触发。

补充说明

在上述解决方案中,用户可以使用occurrences过滤器和属性来实现在一定时间范围内多次检查失败时将检查标记为警告或错误。根据用户的需求,可以根据实际情况调整occurrences的值,以及在处理程序中添加其他操作,比如发送通知邮件等。

备注

用户还提到了refreshinterval属性。这两个属性用于控制检查的刷新间隔和执行间隔。用户可以根据自己的需求调整这些属性的值。根据用户提供的信息,refreshinterval之间似乎存在以下关系:occurrences * interval = refresh。这意味着当occurrences设置为6,interval设置为10时,refresh应为60,用户可以根据需要进行调整。

用户可以根据上述步骤和补充说明,在Sensu中实现在一定时间范围内多次检查失败时将检查标记为警告或错误的功能。

注意: 以上解决方案适用于Sensu的特定版本,可能在不同版本中有所差异。在实际操作中,请根据您使用的Sensu版本和文档进行适当的调整。

希望这个解决方案对您有帮助!如果您有任何进一步的问题或需要更多的帮助,请随时提问。

正文完