基础设施监控基础:从Telegraf、InfluxDB和Grafana开始
作者:Jason Myers / 开发者
2024年4月5日
导航至
确保应用程序和系统的可靠性和性能对于健康的基础设施至关重要。随着数据的指数级增长,传统的监控方法无法提供实时洞察和主动问题解决。这正是InfluxDB发挥作用的地方,它提供了一个强大且可扩展的解决方案,满足您的所有监控需求。
本次网络研讨会涵盖了使用TIG堆栈、Telegraf、InfluxDB和Grafana进行基础设施监控的基础知识。本次研讨会涵盖了包括监控与可观察性之间的区别、使用Telegraf进行数据收集、InfluxDB进行数据存储和Grafana进行数据可视化和行动在内的多个主题。为了说明这些概念,开发者倡导者Anais Dotis-Georgiou提出了假设问题,并展示了如何使用所提到的工具来解决问题。
亮点
1. Telegraf、InfluxDB和Grafana的组合实现了全面的基础设施监控
Anais讨论了如何使用这三个工具进行有效的基础设施监控。开源代理Telegraf用于数据收集。“Telegraf是我们的开源插件,开源代理用于收集指标和事件。它由插件驱动,并在GitHub上有超过12,000颗星,”她指出。
InfluxDB是一个时间序列数据库,是存储组件。基于FDAP堆栈的InfluxDB 3.0,包括Apache Flight、DataFusion、Arrow和Parquet,使其能够处理大量时间序列数据。这些开源技术还使得将InfluxDB与其它工具和系统扩展和集成变得容易。因此,InfluxDB 3.0提供了更多的互操作性,使开发者可以使用各种Python库和其他工具进行ETL。
最后一个工具是Grafana,主要用于数据可视化和警报。“我们将Grafana用作可观察性中心……我们可以使用Flight SQL插件或官方InfluxDB v3插件以及Jaeger数据源从InfluxDB 3.0查询数据,在那里我们汇总了所有日志、跟踪、事件和指标,”她详细说明了。“Grafana和InfluxDB有着非常好的长期关系。它是我们期望用户与InfluxDB一起使用的首选可视化工具。”
2. InfluxDB 3.0在处理时间序列数据方面带来了显著的改进
InfluxDB被设计用于处理时间序列数据,新版本InfluxDB 3.0带来了显著的改进。增强的存储和压缩使用户能够使用更少的空间处理和存储大量数据。它也比之前的版本更快地摄取数据,并允许用户使用SQL实时查询这些数据。
Anais进一步强调了InfluxDB 3.0如何允许开发者摄取日志、跟踪和事件,而不仅仅是指标。灵活性和数据库处理大量数据的能力使其成为物联网、分析和云原生服务的理想解决方案。
“我们提供基于云和边缘的InfluxDB服务。因此,可能存在一些用例,用户希望将数据更接近其源头。所以他们可能会在将数据写入更全球可见的存储之前,先对数据进行降采样和聚合,”她指出。
3. Telegraf的多功能性使其成为数据收集的有价值工具
Telegraf是一个开源的数据收集代理,由于其插件驱动的特性,具有高度的多功能性。Anais描述了它支持超过300个插件,用于数据摄取和输出,使其成为时间序列数据中最适应的摄取代理之一。
“Telegraf是我们用于收集指标和事件的开源代理。它是插件驱动的,在GitHub上拥有超过12,000颗星,”她说道。Anais强调了Telegraf是由社区驱动的,大多数插件都是由社区贡献的。
她还解释了如何通过单个文件配置Telegraf,并使用各种标志在提交之前测试配置。这种配置和测试的便捷性使Telegraf成为用户友好的数据收集工具。
网络研讨会中的示例证实了这一点。Anais解释说:“我们将Telegraf用作收集后盾。我们在所有服务器和云基础设施上部署了它,以收集OpenTelemetry数据、Prometheus和CloudWatch数据,以及基于服务器的原始指标。”
下一步
在基础设施监控方面,时间序列数据至关重要。而在时间序列数据方面,InfluxDB是让您完全控制数据的解决方案,并允许您利用它进行更多操作。
要亲自尝试InfluxDB,请今天免费注册账户。