在生产环境和规模化场景中监控 InfluxDB 2.0
作者:Russ Savage / 产品, 用例, 开发者
2021年2月17日
导航至
InfluxDB 的优点之一是它非常容易上手和运行,并且当您处理适合本地开发机器的数据集时,不需要太多监控。
一旦您开始在生产环境中使用 InfluxDB 并向系统中推送数量级更多的数据时,监控您的实例性能至关重要,这样您才能主动响应磁盘或网络故障、内存饱和以及写入或查询负载等问题。如果没有这种监控,您将如同盲人摸象。这就是我创建 OSS InfluxDB 2.0 监控模板的原因——因为我想要一种简单的方法来监控我的开源实例。
免费且可扩展的监控模板
OSS InfluxDB 2.0 监控模板可用于监控单个实例或整个 InfluxDB OSS 实例集群。它包含 1 个指标仪表板,如下所示。
它可以通过注册免费的 InfluxDB 云账户来安装。注册账户是免费的,并且不需要信用卡,所以您甚至无需找到钱包即可完成注册—— 而且,最近我总是把钱包放在另一条运动裤里!
这个模板,和其他 InfluxDB 模板一样,让您可以快速在一个易于共享的开源文本文件中定义您的整个监控配置(数据源、仪表板和警报),并且只需一个命令即可导入到 InfluxDB 中。
即时启动的 InfluxDB 2.0 监控
开发者们,正如我经常从社区听到的,喜欢他们能够安装模板并立即看到关于其 OSS 实例的指标。这为他们进一步定制 OSS 实例的监控以满足自身需求提供了一个良好的起点。许多开发者使用此模板并添加额外的图表以及警报,以完善其环境的监控能力。
虽然警报不是此模板的一部分,但它非常容易设置。包含的仪表板提供了哪些指标可能有趣的思路,一旦您对这些指标的形状有所了解,就可以在 InfluxDB UI 中轻松添加阈值或死信警报。您还可以配置 UI 将警报直接发送到您团队的 Slack 频道。
您可以跟踪的 InfluxDB 指标
此模板中跟踪的指标包括关于您的 OSS 实例中资源的信息,以及关于已用存储量和已发出查询数量的指标。当您的开源实例性能下降时,这些是第一层调查。有关跟踪指标的更多信息,请访问模板的 GitHub 页面。
使用多个 InfluxDB 模板
还有一些其他 InfluxDB 模板与此模板配合良好,包括 Operational Monitoring Template(运维监控模板)。我还建议使用 Linux System Monitoring Template(Linux 系统监控模板)来跟踪重要的系统统计信息。
在某些情况下,您可能希望将 OSS InfluxDB 2.0 监控模板与 OSS InfluxDB 1.X 监控模板一起使用。很可能,您拥有一个包含多种不同版本软件的异构环境。由于并非所有团队都会立即将其 InfluxDB 实例更新到最新的 2.0 版本,您仍然可以使用您的 InfluxDB 云账户来监控所有版本的 InfluxDB,这就是此模板的用武之地。为每个数据库版本收集的指标略有不同——这就是 InfluxDB 2.0 拥有自己模板的原因。
有兴趣提交您自己的 InfluxDB 模板吗?了解如何使用和构建模板。