Supervisor 和 Cortex 集成

强大的性能和简单的集成,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

info

这不是实时大规模查询的推荐配置。 为了查询和压缩优化、高速摄取和高可用性,您可能需要考虑Supervisor 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时序数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它会更有价值。 借助 InfluxDB,由 Telegraf 构建的排名第一的时序平台可随之扩展。

查看入门方法

输入和输出集成概述

此插件使用 XML-RPC API 收集有关在 Supervisor 下运行的进程的信息。

此插件使 Telegraf 能够使用 Prometheus remote write 协议将指标发送到 Cortex,从而实现无缝摄取到 Cortex 可扩展的多租户时序存储中。

集成详情

Supervisor

Telegraf 的 Supervisor 插件旨在通过其 XML-RPC API 收集有关 Supervisor 进程控制系统管理的进程的指标。 该插件能够跟踪各种指标,包括进程状态和正常运行时间,并提供通过包含或排除列表配置要收集的指标的选项。 此集成对于监控在 Supervisor 下运行的应用程序特别有用,可以深入了解其运行状态和性能指标。 最低测试 Supervisor 版本为 3.3.2,建议使用基本身份验证来保护 HTTP 服务器,以获得更好的安全性。

Cortex

借助 Telegraf 的 HTTP 输出插件和 prometheusremotewrite 数据格式,您可以将指标直接发送到 Cortex,这是一个用于 Prometheus 的水平可扩展的长期存储后端。 Cortex 支持多租户,并使用 Prometheus protobuf 格式接受 remote write 请求。 通过使用 Telegraf 作为收集代理和 Remote Write 作为传输机制,组织可以将可观测性扩展到 Prometheus 本身不支持的来源(例如 Windows 主机、支持 SNMP 的设备或自定义应用程序指标),同时利用 Cortex 的高可用性和长期保留能力。

配置

Supervisor

[[inputs.supervisor]]
  ## Url of supervisor's XML-RPC endpoint if basic auth enabled in supervisor http server,
  ## than you have to add credentials to url (ex. http://login:pass@localhost:9001/RPC2)
  # url="http://localhost:9001/RPC2"
  ## With settings below you can manage gathering additional information about processes
  ## If both of them empty, then all additional information will be collected.
  ## Currently supported supported additional metrics are: pid, rc
  # metrics_include = []
  # metrics_exclude = ["pid", "rc"]

Cortex

[[outputs.http]]
  ## Cortex Remote Write endpoint
  url = "http://cortex.example.com/api/v1/push"

  ## Use POST to send data
  method = "POST"

  ## Send metrics using Prometheus remote write format
  data_format = "prometheusremotewrite"

  ## Optional HTTP headers for authentication
  # [outputs.http.headers]
  #   X-Scope-OrgID = "your-tenant-id"
  #   Authorization = "Bearer YOUR_API_TOKEN"

  ## Optional TLS configuration
  # tls_ca = "/path/to/ca.pem"
  # tls_cert = "/path/to/cert.pem"
  # tls_key = "/path/to/key.pem"
  # insecure_skip_verify = false

  ## Request timeout
  timeout = "10s"

输入和输出集成示例

Supervisor

  1. 集中式监控仪表板:实施此插件以将 Supervisor 指标直接馈送到集中式监控仪表板,使团队能够实时可视化其应用程序的健康状况和性能。 此集成可以快速识别问题,帮助跟踪一段时间内的服务性能,并根据观察到的趋势帮助进行容量规划。

  2. 进程故障警报:利用 Supervisor 插件收集的指标来创建警报机制,当关键进程关闭或进入致命状态时,该机制会通知工程师。 通过在监控系统中设置阈值,团队可以主动响应潜在问题,最大限度地减少停机时间并确保系统可靠性。

  3. 进程状态的历史分析:存储随时间收集的指标以分析进程状态变化和模式。 通过检查历史数据,团队可以识别重复出现的问题,跟踪部署更改的影响,并根据进程趋势优化资源分配,从而提高整体系统性能。

  4. 与事件管理系统集成:配置 Supervisor 插件以在进程达到临界状态时自动向 PagerDuty 或 OpsGenie 等事件管理系统发送警报。 此集成简化了事件响应流程,确保及时通知正确的团队成员,并且可以立即采取行动。

Cortex

  1. 统一的多租户监控:使用 Telegraf 从不同的团队或环境收集指标,并将它们与单独的 X-Scope-OrgID 标头一起推送到 Cortex。 这实现了每个租户的隔离数据摄取和查询,非常适合托管服务和平台团队。

  2. 将 Prometheus 覆盖范围扩展到边缘设备:在边缘或物联网设备上部署 Telegraf 以收集系统指标并将它们发送到集中的 Cortex 集群。 即使对于没有本地 Prometheus 抓取器的环境,这种方法也能确保一致的可观测性。

  3. 具有联邦租户的全球服务可观测性:通过配置 Telegraf 代理将数据推送到区域 Cortex 集群(每个集群都标有租户标识符)来聚合来自全球基础设施的指标。 Cortex 处理跨区域的重复数据删除和集中访问。

  4. 自定义应用遥测管道:通过 Telegraf 的 exechttp 输入插件收集特定于应用的遥测数据,并将其转发到 Cortex。 这使 DevOps 团队能够以可扩展、查询高效的格式监控特定于应用的 KPI,同时保持指标按租户或服务进行逻辑分组。

反馈

感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它会更有价值。 借助 InfluxDB,由 Telegraf 构建的排名第一的时序平台可随之扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。 它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许基于这些消息创建指标。 它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流中读取指标。 它支持多种输入数据格式,并提供带有 DynamoDB 的检查点功能,以实现可靠的消息处理。

查看集成