Supervisor 和 Mimir 集成

强大的性能和简单的集成,由 Telegraf 提供支持,Telegraf 是 InfluxData 构建的开源数据连接器。

info

这不是大规模实时查询的推荐配置。 为了查询和压缩优化、高速摄取和高可用性,您可能需要考虑 Supervisor 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时间序列数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时间序列数据时,它会更有价值。 使用 InfluxDB,排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

输入和输出集成概述

此插件使用 XML-RPC API 收集有关在 Supervisor 下运行的进程的信息。

此插件使用 HTTP 将 Telegraf 指标直接发送到 Grafana 的 Mimir 数据库,为 Prometheus 兼容的指标提供可扩展且高效的长期存储和分析。

集成详情

Supervisor

Telegraf 的 Supervisor 插件旨在通过其 XML-RPC API 收集有关由 Supervisor 进程控制系统管理的进程的指标。 该插件能够跟踪各种指标,包括进程状态和正常运行时间,并提供用于配置通过包含或排除列表收集哪些指标的选项。 此集成对于监视在 Supervisor 下运行的应用程序特别有用,可深入了解其运行状态和性能指标。 最低测试 Supervisor 版本为 3.3.2,建议使用基本身份验证来保护 HTTP 服务器,以提高安全性。

Mimir

Grafana Mimir 支持 Prometheus Remote Write 协议,使 Telegraf 收集的指标能够有效地摄取到 Mimir 集群中,以实现大规模、长期存储。 此集成利用 Prometheus 的成熟标准,允许用户将 Telegraf 广泛的数据收集功能与 Mimir 的高级功能(例如查询联合、多租户、高可用性和经济高效的存储)相结合。 Grafana Mimir 的架构经过优化,可处理大量指标数据并提供快速查询响应,使其成为复杂监控环境和分布式系统的理想选择。

配置

Supervisor

[[inputs.supervisor]]
  ## Url of supervisor's XML-RPC endpoint if basic auth enabled in supervisor http server,
  ## than you have to add credentials to url (ex. http://login:pass@localhost:9001/RPC2)
  # url="http://localhost:9001/RPC2"
  ## With settings below you can manage gathering additional information about processes
  ## If both of them empty, then all additional information will be collected.
  ## Currently supported supported additional metrics are: pid, rc
  # metrics_include = []
  # metrics_exclude = ["pid", "rc"]

Mimir

[[outputs.http]]
  url = "http://data-load-balancer-backend-1:9009/api/v1/push"
  data_format = "prometheusremotewrite"
  username = "*****"
  password = "******"
  [outputs.http.headers]
     Content-Type = "application/x-protobuf"
     Content-Encoding = "snappy"
     X-Scope-OrgID = "****"

输入和输出集成示例

Supervisor

  1. 集中式监控仪表板:实施此插件以将 Supervisor 指标直接馈送到集中式监控仪表板,使团队能够实时可视化其应用程序的健康状况和性能。 此集成可以快速识别问题,帮助跟踪随时间推移的服务性能,并根据观察到的趋势帮助进行容量规划。

  2. 进程故障警报:利用 Supervisor 插件收集的指标来创建警报机制,当关键进程关闭或进入致命状态时,该机制会通知工程师。 通过在监控系统中设置阈值,团队可以主动响应潜在问题,最大限度地减少停机时间并确保系统可靠性。

  3. 进程状态的历史分析:存储随时间推移收集的指标,以分析进程状态变化和模式。 通过检查历史数据,团队可以识别重复出现的问题,跟踪部署更改的影响,并根据进程趋势优化资源分配,从而提高整体系统性能。

  4. 与事件管理系统集成:配置 Supervisor 插件以在进程达到临界状态时自动向 PagerDuty 或 OpsGenie 等事件管理系统发送警报。 此集成简化了事件响应流程,确保及时通知正确的团队成员,并且可以立即采取行动。

Mimir

  1. 企业级 Kubernetes 监控:将 Telegraf 与 Grafana Mimir 集成,以企业规模从 Kubernetes 集群流式传输指标。 这实现了全面的可见性、改进的资源分配以及跨数百个集群的主动故障排除,从而利用 Mimir 的水平可扩展性和高可用性。

  2. 多租户 SaaS 应用程序可观测性:使用此插件将来自不同 SaaS 租户的指标集中到 Grafana Mimir 中,从而实现租户隔离和基于资源使用情况的准确计费。 这种方法提供可靠的可观测性、高效的成本管理和安全的多租户支持。

  3. 全球边缘网络性能跟踪:将来自全球分布式边缘服务器的延迟和可用性指标流式传输到 Grafana Mimir 中。 组织可以快速识别性能下降或中断,利用 Mimir 的快速查询功能来确保最佳的服务可靠性和用户体验。

  4. 高容量微服务的实时分析:在高容量微服务架构中实施 Telegraf 指标收集,将数据馈送到 Grafana Mimir 以进行实时分析和异常检测。 Mimir 强大的查询功能使团队能够检测异常并快速响应,从而保持高服务可用性和性能。

反馈

感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时间序列数据时,它会更有价值。 使用 InfluxDB,排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。 它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许根据这些消息创建指标。 它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流中读取指标。 它支持多种输入数据格式,并提供带有 DynamoDB 的检查点功能,以实现可靠的消息处理。

查看集成