在生产环境中大规模监控InfluxDB 2.0
作者:Russ Savage / 产品,用例,开发者
2021年2月17日
导航到
InfluxDB的其中一个优点是它非常容易启动并运行,在处理适合本地开发机器的本地数据集时,它不需要太多的监控。
一旦您开始在生产中使用InfluxDB并将数量级的更多数据推送到系统中,监控您的实例性能就变得至关重要,这样您就可以主动响应诸如磁盘或网络故障、内存饱和以及写入或查询负载等问题。如果没有这种监控,您将像盲人一样摸索。这就是我创建开源InfluxDB 2.0监控模板的原因——因为我想要一种简单的方法来监控我的开源实例。
免费且可扩展的监控模板
开源InfluxDB 2.0监控模板可以用来监控单个实例或整个InfluxDB OSS实例集群。它包含一个指标仪表板,如下所示。
您可以通过注册免费InfluxDB云账户来安装此模板。注册账户免费,无需信用卡,您甚至不需要找到钱包——此外,现在,我总是把钱包放在另一条运动裤里!
这个模板,就像其他InfluxDB模板一样,允许您在一个易于共享的开源文本文件中快速定义整个监控配置(数据源、仪表板和警报),然后可以通过一条命令将其导入InfluxDB。
即时启动InfluxDB 2.0监控
开发者们,正如我经常从社区中听到的那样,喜欢他们能够立即安装模板并看到他们开源实例的指标。这为他们提供了一个很好的起点,以根据他们的需求进一步自定义他们的开源实例监控。许多开发者使用这个模板添加额外的图表以及警报,以完成他们环境的监控能力。
尽管警报不是这个模板的一部分,但它设置起来非常简单。包含的仪表板提供了一个关于哪些指标可能有趣的思路,一旦您了解了这些指标的模式,在InfluxDB UI中添加阈值或看门狗警报就非常简单了。您还可以配置UI将警报直接发送到您团队的Slack频道。
您可以跟踪的InfluxDB指标
此模板跟踪的指标包括您开源实例中的资源信息,以及关于使用多少存储空间和发出的查询数量的指标。当您的开源实例的性能下降时,这些都是调查的第一层。有关跟踪的指标更多信息的详细信息,请访问模板的GitHub页面。
使用多个InfluxDB模板
有一些其他与该模板兼容的 InfluxDB 模板表现良好,包括运营监控模板。我还推荐您使用Linux 系统监控模板来跟踪重要的系统统计信息。
在某些场景中,您可能希望将 OSS InfluxDB 2.0 监控模板与 OSS InfluxDB 1.X 监控模板结合使用。很可能您有一个包含许多不同版本软件的异构环境。由于并非所有团队都会立即将他们的 InfluxDB 实例更新到最新的 2.0 版本,您仍然可以使用您的 InfluxDB Cloud 账户来监控所有版本的 InfluxDB,这正是该模板变得有用的地方。收集的每个数据库版本的指标略有不同——这就是为什么 InfluxDB 2.0 有自己的模板。