Zipkin 和 Cortex 集成

强大的性能和简单的集成,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

info

这不是实时大规模查询的推荐配置。为了查询和压缩优化、高速摄取和高可用性,您可能需要考虑 Zipkin 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时间序列数据库
来源:DB-Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

输入和输出集成概述

Zipkin 输入插件允许从微服务收集跟踪信息和时间数据。此功能对于诊断复杂面向服务环境中的延迟问题至关重要。

此插件使 Telegraf 能够使用 Prometheus 远程写入协议将指标发送到 Cortex,从而实现无缝摄取到 Cortex 的可扩展、多租户时间序列存储中。

集成详情

Zipkin

此插件实现了 Zipkin HTTP 服务器,以收集跟踪和时间数据,这对于解决微服务架构中的延迟问题至关重要。Zipkin 是一个分布式跟踪系统,可帮助收集跨各种微服务的时间数据,使团队能够可视化请求流并识别性能瓶颈。该插件支持基于指定 Content-Type 的 JSON 或 thrift 格式的输入跟踪。此外,它还利用 span 元数据来跟踪请求的计时,从而增强对遵循 OpenTracing 标准的应用程序的可观察性。作为一项实验性功能,其配置和模式可能会随着时间的推移而演变,以更好地满足用户需求和分布式跟踪方法的发展。

Cortex

借助 Telegraf 的 HTTP 输出插件和 prometheusremotewrite 数据格式,您可以将指标直接发送到 Cortex,Cortex 是 Prometheus 的水平可扩展、长期存储后端。Cortex 支持多租户,并接受使用 Prometheus protobuf 格式的远程写入请求。通过使用 Telegraf 作为收集代理,并使用远程写入作为传输机制,组织可以将可观察性扩展到 Prometheus 本身不支持的来源(例如 Windows 主机、启用 SNMP 的设备或自定义应用程序指标),同时利用 Cortex 的高可用性和长期保留能力。

配置

Zipkin

[[inputs.zipkin]]
  ## URL path for span data
  # path = "/api/v1/spans"

  ## Port on which Telegraf listens
  # port = 9411

  ## Maximum duration before timing out read of the request
  # read_timeout = "10s"
  ## Maximum duration before timing out write of the response
  # write_timeout = "10s"

Cortex

[[outputs.http]]
  ## Cortex Remote Write endpoint
  url = "http://cortex.example.com/api/v1/push"

  ## Use POST to send data
  method = "POST"

  ## Send metrics using Prometheus remote write format
  data_format = "prometheusremotewrite"

  ## Optional HTTP headers for authentication
  # [outputs.http.headers]
  #   X-Scope-OrgID = "your-tenant-id"
  #   Authorization = "Bearer YOUR_API_TOKEN"

  ## Optional TLS configuration
  # tls_ca = "/path/to/ca.pem"
  # tls_cert = "/path/to/cert.pem"
  # tls_key = "/path/to/key.pem"
  # insecure_skip_verify = false

  ## Request timeout
  timeout = "10s"

输入和输出集成示例

Zipkin

  1. 微服务中的延迟监控:使用 Zipkin 输入插件捕获和分析来自微服务架构的跟踪数据。通过可视化请求流并查明延迟源,开发团队可以优化服务交互,缩短响应时间,并确保跨服务更流畅的用户体验。

  2. 关键服务中的性能优化:在关键服务中集成插件,不仅可以监控响应时间,还可以跟踪可能突出显示性能问题的特定注释。收集 span 数据的能力有助于确定需要性能增强的区域的优先级,从而实现有针对性的改进。

  3. 动态服务依赖关系映射:使用收集的跟踪数据,自动映射服务依赖关系并在仪表板中可视化它们。这有助于团队了解不同服务如何交互以及故障或减速的影响,最终实现更好的架构决策和更快的问题解决。

  4. 服务延迟中的异常检测:将 Zipkin 数据与机器学习模型结合使用,以检测服务延迟和请求处理时间中的异常模式。通过自动识别异常,运营团队可以主动响应新兴问题,防止它们升级为严重故障。

Cortex

  1. 统一的多租户监控:使用 Telegraf 从不同的团队或环境收集指标,并将它们与单独的 X-Scope-OrgID 标头一起推送到 Cortex。这实现了每个租户的隔离数据摄取和查询,非常适合托管服务和平台团队。

  2. 将 Prometheus 覆盖范围扩展到边缘设备:在边缘或物联网设备上部署 Telegraf 以收集系统指标,并将它们发送到集中的 Cortex 集群。即使对于没有本地 Prometheus 抓取器的环境,此方法也能确保一致的可观察性。

  3. 具有联合租户的全局服务可观察性:通过配置 Telegraf 代理将数据推送到区域 Cortex 集群(每个集群都标记有租户标识符)来聚合来自全局基础设施的指标。Cortex 处理跨区域的重复数据删除和集中访问。

  4. 自定义应用程序遥测管道:通过 Telegraf 的 exechttp 输入插件收集特定于应用程序的遥测数据,并将其转发到 Cortex。这使 DevOps 团队能够以可扩展、查询高效的格式监控特定于应用程序的 KPI,同时保持按租户或服务逻辑分组的指标。

反馈

感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许基于这些消息创建指标。它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流中读取指标。它支持多种输入数据格式,并提供带有 DynamoDB 的检查点功能,以实现可靠的消息处理。

查看集成