目录
输入和输出集成概述
此插件使用 XML-RPC API 收集有关在 Supervisor 下运行的进程的信息。
此插件使 Telegraf 能够将指标直接流式传输到 Grafana 仪表板,利用 Grafana Live 进行即时数据可视化和操作洞察。
集成详情
Supervisor
Telegraf 的 Supervisor 插件旨在通过其 XML-RPC API 收集有关 Supervisor 进程控制系统管理的进程的指标。该插件能够跟踪各种指标,包括进程状态和正常运行时间,并提供通过包含或排除列表配置要收集哪些指标的选项。此集成对于监控在 Supervisor 下运行的应用程序特别有用,可以深入了解其运行状态和性能指标。最低测试 Supervisor 版本为 3.3.2,建议使用基本身份验证保护 HTTP 服务器以提高安全性。
Grafana
Telegraf 可以使用 Websocket 输出插件将实时数据发送到 Grafana。Telegraf 收集的指标会立即推送到 Grafana 仪表板,从而实现实时可视化和分析。此插件非常适合需要低延迟、实时数据可视化的用例,例如操作监控、实时分析和即时事件响应场景。它支持身份验证标头、可自定义的数据序列化格式(如 JSON)以及通过 TLS 的安全通信,在动态、交互式仪表板环境中提供灵活性和易于集成。
配置
Supervisor
[[inputs.supervisor]]
## Url of supervisor's XML-RPC endpoint if basic auth enabled in supervisor http server,
## than you have to add credentials to url (ex. http://login:pass@localhost:9001/RPC2)
# url="http://localhost:9001/RPC2"
## With settings below you can manage gathering additional information about processes
## If both of them empty, then all additional information will be collected.
## Currently supported supported additional metrics are: pid, rc
# metrics_include = []
# metrics_exclude = ["pid", "rc"]
Grafana
[[outputs.websocket]]
## Grafana Live WebSocket endpoint
url = "ws://localhost:3000/api/live/push/custom_id"
## Optional headers for authentication
# [outputs.websocket.headers]
# Authorization = "Bearer YOUR_GRAFANA_API_TOKEN"
## Data format to send metrics
data_format = "influx"
## Timeouts (make sure read_timeout is larger than server ping interval or set to zero).
# connect_timeout = "30s"
# write_timeout = "30s"
# read_timeout = "30s"
## Optionally turn on using text data frames (binary by default).
# use_text_frames = false
## TLS configuration
# tls_ca = "/path/to/ca.pem"
# tls_cert = "/path/to/cert.pem"
# tls_key = "/path/to/key.pem"
# insecure_skip_verify = false
输入和输出集成示例
Supervisor
-
集中式监控仪表板:实施此插件以将 Supervisor 指标直接馈送到集中式监控仪表板,使团队能够实时可视化其应用程序的健康状况和性能。此集成可以快速识别问题,帮助跟踪一段时间内的服务性能,并有助于根据观察到的趋势进行容量规划。
-
进程故障警报:利用 Supervisor 插件收集的指标创建警报机制,以便在关键进程关闭或进入致命状态时通知工程师。通过在您的监控系统中设置阈值,团队可以主动响应潜在问题,最大限度地减少停机时间并确保系统可靠性。
-
进程状态的历史分析:存储随时间收集的指标,以分析进程状态更改和模式。通过检查历史数据,团队可以识别重复出现的问题,跟踪部署更改的影响,并根据进程趋势优化资源分配,从而提高整体系统性能。
-
与事件管理系统集成:配置 Supervisor 插件以在进程达到关键状态时自动向 PagerDuty 或 OpsGenie 等事件管理系统发送警报。此集成简化了事件响应流程,确保及时通知合适的团队成员,并可以立即采取行动。
Grafana
-
实时基础设施仪表板:部署 Telegraf 将服务器健康指标直接流式传输到 Grafana 仪表板,使 IT 团队能够实时可视化基础设施性能。此设置允许立即检测和响应关键系统事件。
-
交互式物联网监控:集成 Telegraf 收集的物联网设备指标,并将实时数据推送到 Grafana,创建动态和交互式仪表板,用于监控智慧城市项目或制造过程。这种实时可见性显着提高了响应能力和运营效率。
-
即时应用程序性能分析:将来自生产环境的应用程序指标实时流式传输到 Grafana 仪表板,使开发团队能够在部署期间快速检测和诊断性能瓶颈或异常,最大限度地减少停机时间并提高可靠性。
-
实时事件分析:在重大现场活动期间,利用 Telegraf 捕获和流式传输实时受众或系统指标,直接进入 Grafana 仪表板。活动组织者可以动态监控并对不断变化的条件或趋势做出反应,从而显着提高受众参与度和运营决策能力。
反馈
感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。