Graylog监控

导航至

我们经常被问及使用Telegraf插件支持的各种产品应该收集哪些指标并采取行动。当然,这取决于产品本身(它是一个可以收集吞吐量、延迟等指标的网络服务器,或者你可能想要跟踪容量或延迟的数据库)。但是用问题回答客户的问题并不太有用,我很高兴地告诉您,我们 Graylog 的朋友写了一篇关于使用 InfluxData 监控 Graylog 服务器以保持其运行的博客,这是一个很好的话题。这尤其重要,因为保持 Graylog 服务器运行的目的就是让您的日志数据可用和可访问,以帮助您发现和解决问题!

特别是,他们建议您查看5个核心指标(磁盘IO利用率、可用磁盘空间、CPU使用率、内存使用率、可用文件描述符)以确保您的系统处于可接受的状态。他们也提到,这5个指标中最重要的是可用磁盘空间,因为如果您没有的话可能会遇到一些严重的问题。

接下来是什么

查看他们的博客,并尝试使用 InfluxDB 和 Graylog Telegraf 插件自行收集指标!我们认为您会对结果感到满意!