如何设置基础设施状态检查的简单服务

45次阅读
没有评论

问题描述

是一名独立的IT人员,他有一个简单的设置:在本地服务器上运行一些服务,并且这些服务应该每天产生一个日志文件。他希望在某种情况下,如果这个日志文件没有生成,能够收到通知。他编写了一个脚本,并通过cron定时运行,如果日志文件没有生成,脚本会发送一封电子邮件给他。然而,如果整个服务器崩溃了,或者他的电子邮件脚本有一个bug等等,这种方法显然是不可靠的。因此,他希望有一个每天检查并在日志文件没有生成时发送电子邮件的系统。他在www.duplicati-monitoring.com上实现了这个功能:即使他的本地服务器宕机,他也能收到电子邮件。他想将这个功能扩展到更多的基础设施测试中。
用户想知道这种系统被称为什么,是否有提供这种功能的网站(最好是免费/开源的)。他查看了一些工具,如nagios,但它似乎太庞大了,而且似乎需要自己托管。

解决方案

请注意以下操作注意版本差异及修改前做好备份。

方案1

这种系统通常被称为看门狗(watchdog)、死亡检测(deadman)或健康检查(health check)。你可以使用一些工具来实现这个功能。
1. 使用像monit这样的工具,将其部署在像GCE或AWS这样的地方。Monit是一个轻量级的工具,可以监控和管理UNIX系统上的进程、文件和目录。你可以使用Monit来监控你的日志文件是否生成,并在出现问题时发送电子邮件通知。
2. 使用外部服务或服务器。有一些手机应用程序可以帮助你进行ping测试和HTTP请求,并在条件不满足时发送通知和/或声音警报。由于你是一个独立的IT人员,使用自己的手机并不会增加单点故障的风险,但是当你的团队扩大时,你需要有一个迁移计划。
3. 使用树莓派等设备进行ping测试,并在ping状态异常时发送电子邮件。这种方法简单直接,但需要有一个设备来执行ping测试。

方案2

你还可以使用一些在线服务来实现这个功能。以下是一些免费或开源的在线服务:
Freshping:Freshping是一个免费的网站监控工具,可以帮助你监控你的基础设施,并在出现问题时发送通知。
Heartbeat.sh:Heartbeat.sh是一个开源的基础设施监控工具,可以帮助你监控你的服务器,并在出现问题时发送通知。
这些在线服务可以帮助你监控你的基础设施,并在出现问题时发送通知。你可以选择适合你需求的服务,并按照它们的文档进行设置。

方案3

你还可以使用自己的服务器来实现这个功能。以下是一种简单的方法:
1. 在你的服务器上创建一个文本文件,内容为”ok”。你可以使用任何文本编辑器创建这个文件。
2. 使用一个Web服务器(如Nginx或Apache)将这个文件作为静态文件提供出去。你可以将这个文件放在Web服务器的根目录下,或者创建一个专门的目录来存放这个文件。
3. 使用一个外部服务(如Freshping或Heartbeat.sh)来定期访问这个文件,并在文件内容不是”ok”时发送通知。
这种方法非常简单,你只需要一个Web服务器和一个外部服务即可实现基础设施状态检查。
以上是几种实现基础设施状态检查的方法,你可以根据自己的需求选择适合你的方法。希望对你有帮助!

正文完