目录
输入和输出集成概述
此插件使用 XML-RPC API 收集有关在 Supervisor 下运行的进程的信息。
此插件使用 Prometheus 远程写入协议通过 HTTP 将指标从 Telegraf 发送到 Thanos,从而实现高效且可扩展地摄取到 Thanos Receive 组件中。
集成详情
Supervisor
Telegraf 的 Supervisor 插件旨在通过其 XML-RPC API 收集有关 Supervisor 进程控制系统管理的进程的指标。该插件能够跟踪各种指标,包括进程状态和运行时间,并提供通过包含或排除列表配置要收集的指标的选项。此集成对于监控在 Supervisor 下运行的应用程序特别有用,可深入了解其运行状态和性能指标。最低测试 Supervisor 版本为 3.3.2,建议使用基本身份验证保护 HTTP 服务器以获得更好的安全性。
Thanos
Telegraf 的 HTTP 插件可以通过其 Remote Write 兼容的 Receive 组件将指标直接发送到 Thanos。通过将数据格式设置为 prometheusremotewrite
,Telegraf 可以将指标序列化为原生 Prometheus 客户端使用的相同的基于 protobuf 的格式。此设置实现了高吞吐量、低延迟的指标摄取到 Thanos 中,从而促进了大规模的集中式可观测性。这在混合环境中尤其有用,在这些环境中,Telegraf 从 Prometheus 原生范围之外的系统(例如 SNMP 设备、Windows 主机或自定义应用程序)收集指标,并将它们直接流式传输到 Thanos 以进行长期存储和全局查询。
配置
Supervisor
[[inputs.supervisor]]
## Url of supervisor's XML-RPC endpoint if basic auth enabled in supervisor http server,
## than you have to add credentials to url (ex. http://login:pass@localhost:9001/RPC2)
# url="http://localhost:9001/RPC2"
## With settings below you can manage gathering additional information about processes
## If both of them empty, then all additional information will be collected.
## Currently supported supported additional metrics are: pid, rc
# metrics_include = []
# metrics_exclude = ["pid", "rc"]
Thanos
[[outputs.http]]
## Thanos Receive endpoint for remote write
url = "http://thanos-receive.example.com/api/v1/receive"
## HTTP method
method = "POST"
## Data format set to Prometheus remote write
data_format = "prometheusremotewrite"
## Optional headers (authorization, etc.)
# [outputs.http.headers]
# Authorization = "Bearer YOUR_TOKEN"
## Optional TLS configuration
# tls_ca = "/path/to/ca.pem"
# tls_cert = "/path/to/cert.pem"
# tls_key = "/path/to/key.pem"
# insecure_skip_verify = false
## Request timeout
timeout = "10s"
输入和输出集成示例
Supervisor
-
集中监控仪表板:实施此插件以将 Supervisor 指标直接馈送到集中监控仪表板,使团队能够实时可视化其应用程序的健康状况和性能。此集成能够快速识别问题,帮助跟踪随时间推移的服务性能,并有助于根据观察到的趋势进行容量规划。
-
进程故障警报:利用 Supervisor 插件收集的指标来创建警报机制,当关键进程关闭或进入致命状态时通知工程师。通过在您的监控系统中设置阈值,团队可以主动响应潜在问题,最大限度地减少停机时间并确保系统可靠性。
-
进程状态的历史分析:存储随时间收集的指标,以分析进程状态变化和模式。通过检查历史数据,团队可以识别重复出现的问题,跟踪部署更改的影响,并根据进程趋势优化资源分配,从而提高整体系统性能。
-
与事件管理系统集成:配置 Supervisor 插件以在进程达到临界状态时自动向 PagerDuty 或 OpsGenie 等事件管理系统发送警报。此集成简化了事件响应流程,确保及时通知正确的团队成员,并且可以立即采取行动。
Thanos
-
无代理云监控:在云虚拟机上部署 Telegraf 代理以收集系统和应用程序指标,然后使用 Remote Write 将它们直接流式传输到 Thanos。这提供了集中式可观测性,而无需在每个位置都部署 Prometheus 节点。
-
可扩展的 Windows 主机监控:在 Windows 计算机上使用 Telegraf 收集操作系统级别的指标,并通过 Remote Write 将它们发送到 Thanos Receive。这实现了跨异构环境的可观测性,而本机 Prometheus 仅在 Linux 上受支持。
-
跨区域指标联合:多个地理区域中的 Telegraf 代理可以使用此插件将数据推送到区域本地的 Thanos Receivers。从那里,Thanos 可以全局去重和查询指标,从而减少延迟和网络出口成本。
-
将第三方数据集成到 Thanos 中:使用 Telegraf 输入从自定义遥测源(例如 REST API 或专有日志)收集指标,并通过 Remote Write 将它们转发到 Thanos。这会将非原生数据引入 Prometheus 兼容的长期分析管道中。
反馈
感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现了任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。