目录
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法
输入和输出集成概述
此插件使用 XML-RPC API 收集有关 Supervisor 下运行的进程的信息。
Google BigQuery 插件允许 Telegraf 将指标写入 Google Cloud BigQuery,从而为遥测数据实现强大的数据分析功能。
集成详情
Supervisor
Telegraf 的 Supervisor 插件旨在通过其 XML-RPC API 收集有关 Supervisor 进程控制系统管理的进程的指标。该插件能够跟踪各种指标,包括进程状态和正常运行时间,并提供通过包含或排除列表配置要收集哪些指标的选项。此集成对于监控在 Supervisor 下运行的应用程序特别有用,可以深入了解其运行状态和性能指标。最低测试 Supervisor 版本为 3.3.2,建议使用基本身份验证来保护 HTTP 服务器,以提高安全性。
Google BigQuery
Telegraf 的 Google BigQuery 插件实现了与 Google Cloud 的 BigQuery 服务的无缝集成,BigQuery 服务是一个流行的数据仓库和分析平台。此插件有助于将 Telegraf 收集的指标传输到 BigQuery 数据集,使用户可以更轻松地执行分析并从其遥测数据中生成见解。它需要通过服务帐户或用户凭据进行身份验证,并且旨在处理各种数据类型,确保用户在 BigQuery 表中存储指标时可以保持指标的完整性和准确性。配置选项允许围绕数据集规范和处理指标进行自定义,包括管理指标名称中的连字符,BigQuery 的流式插入不支持连字符。对于利用 BigQuery 的可扩展性和强大查询功能来分析大量监控数据的组织而言,此插件特别有用。
配置
Supervisor
[[inputs.supervisor]]
## Url of supervisor's XML-RPC endpoint if basic auth enabled in supervisor http server,
## than you have to add credentials to url (ex. http://login:pass@localhost:9001/RPC2)
# url="http://localhost:9001/RPC2"
## With settings below you can manage gathering additional information about processes
## If both of them empty, then all additional information will be collected.
## Currently supported supported additional metrics are: pid, rc
# metrics_include = []
# metrics_exclude = ["pid", "rc"]
Google BigQuery
# Configuration for Google Cloud BigQuery to send entries
[[outputs.bigquery]]
## Credentials File
credentials_file = "/path/to/service/account/key.json"
## Google Cloud Platform Project
# project = ""
## The namespace for the metric descriptor
dataset = "telegraf"
## Timeout for BigQuery operations.
# timeout = "5s"
## Character to replace hyphens on Metric name
# replace_hyphen_to = "_"
## Write all metrics in a single compact table
# compact_table = ""
输入和输出集成示例
Supervisor
-
集中式监控仪表板:实施此插件以将 Supervisor 指标直接馈送到集中式监控仪表板,使团队能够实时可视化其应用程序的运行状况和性能。此集成可以快速识别问题,帮助跟踪随时间推移的服务性能,并有助于根据观察到的趋势进行容量规划。
-
进程故障警报:利用 Supervisor 插件收集的指标来创建警报机制,当关键进程关闭或进入致命状态时,该机制会通知工程师。通过在监控系统中设置阈值,团队可以主动响应潜在问题,最大限度地减少停机时间并确保系统可靠性。
-
进程状态的历史分析:存储随时间收集的指标,以分析进程状态变化和模式。通过检查历史数据,团队可以识别重复出现的问题,跟踪部署变更的影响,并根据进程趋势优化资源分配,从而提高整体系统性能。
-
与事件管理系统集成:配置 Supervisor 插件以在进程达到临界状态时自动向 PagerDuty 或 OpsGenie 等事件管理系统发送警报。此集成简化了事件响应流程,确保及时通知正确的团队成员,并且可以立即采取行动。
Google BigQuery
-
实时分析仪表板:利用 Google BigQuery 插件将实时指标馈送到 Google Cloud 上托管的自定义分析仪表板。此设置将允许团队实时可视化性能数据,从而深入了解系统运行状况和使用模式。通过使用 BigQuery 的查询功能,用户可以轻松创建量身定制的报告和仪表板以满足其特定需求,从而增强决策过程。
-
成本管理和优化分析:利用该插件自动将来自各种服务的成本相关指标发送到 BigQuery。分析此数据可以帮助企业识别不必要的费用并优化资源使用。通过在 BigQuery 中执行聚合和转换查询,组织可以创建准确的预测并有效地管理其云支出。
-
跨团队协作处理监控数据:使组织内不同的团队能够使用 BigQuery 共享其监控数据。借助此 Telegraf 插件,团队可以将其指标推送到中央 BigQuery 实例,从而促进协作。这种数据共享方法鼓励最佳实践和跨职能意识,从而共同改进系统性能和可靠性。
-
用于容量规划的历史分析:通过使用 BigQuery 插件,公司可以收集和存储对容量规划至关重要的历史指标数据。分析随时间推移的趋势可以帮助预测系统需求并主动扩展基础设施。组织可以创建时间序列分析并识别为长期战略决策提供信息的模式。
反馈
感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提供意见。请在 InfluxDB 社区 Slack 中提交您的反馈。
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法