目录
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法
输入和输出集成概述
Zipkin 输入插件允许从微服务收集跟踪信息和时间数据。此功能对于诊断复杂面向服务环境中的延迟问题至关重要。
此插件使 Telegraf 能够使用 Prometheus 远程写入协议将指标发送到 Cortex,从而实现无缝摄取到 Cortex 的可扩展、多租户时间序列存储中。
集成详情
Zipkin
此插件实现了 Zipkin HTTP 服务器,以收集跟踪和时间数据,这对于解决微服务架构中的延迟问题至关重要。Zipkin 是一个分布式跟踪系统,可帮助收集跨各种微服务的时间数据,使团队能够可视化请求流并识别性能瓶颈。该插件支持基于指定 Content-Type 的 JSON 或 thrift 格式的输入跟踪。此外,它还利用 span 元数据来跟踪请求的计时,从而增强对遵循 OpenTracing 标准的应用程序的可观察性。作为一项实验性功能,其配置和模式可能会随着时间的推移而演变,以更好地满足用户需求和分布式跟踪方法的发展。
Cortex
借助 Telegraf 的 HTTP 输出插件和 prometheusremotewrite
数据格式,您可以将指标直接发送到 Cortex,Cortex 是 Prometheus 的水平可扩展、长期存储后端。Cortex 支持多租户,并接受使用 Prometheus protobuf 格式的远程写入请求。通过使用 Telegraf 作为收集代理,并使用远程写入作为传输机制,组织可以将可观察性扩展到 Prometheus 本身不支持的来源(例如 Windows 主机、启用 SNMP 的设备或自定义应用程序指标),同时利用 Cortex 的高可用性和长期保留能力。
配置
Zipkin
[[inputs.zipkin]]
## URL path for span data
# path = "/api/v1/spans"
## Port on which Telegraf listens
# port = 9411
## Maximum duration before timing out read of the request
# read_timeout = "10s"
## Maximum duration before timing out write of the response
# write_timeout = "10s"
Cortex
[[outputs.http]]
## Cortex Remote Write endpoint
url = "http://cortex.example.com/api/v1/push"
## Use POST to send data
method = "POST"
## Send metrics using Prometheus remote write format
data_format = "prometheusremotewrite"
## Optional HTTP headers for authentication
# [outputs.http.headers]
# X-Scope-OrgID = "your-tenant-id"
# Authorization = "Bearer YOUR_API_TOKEN"
## Optional TLS configuration
# tls_ca = "/path/to/ca.pem"
# tls_cert = "/path/to/cert.pem"
# tls_key = "/path/to/key.pem"
# insecure_skip_verify = false
## Request timeout
timeout = "10s"
输入和输出集成示例
Zipkin
-
微服务中的延迟监控:使用 Zipkin 输入插件捕获和分析来自微服务架构的跟踪数据。通过可视化请求流并查明延迟源,开发团队可以优化服务交互,缩短响应时间,并确保跨服务更流畅的用户体验。
-
关键服务中的性能优化:在关键服务中集成插件,不仅可以监控响应时间,还可以跟踪可能突出显示性能问题的特定注释。收集 span 数据的能力有助于确定需要性能增强的区域的优先级,从而实现有针对性的改进。
-
动态服务依赖关系映射:使用收集的跟踪数据,自动映射服务依赖关系并在仪表板中可视化它们。这有助于团队了解不同服务如何交互以及故障或减速的影响,最终实现更好的架构决策和更快的问题解决。
-
服务延迟中的异常检测:将 Zipkin 数据与机器学习模型结合使用,以检测服务延迟和请求处理时间中的异常模式。通过自动识别异常,运营团队可以主动响应新兴问题,防止它们升级为严重故障。
Cortex
-
统一的多租户监控:使用 Telegraf 从不同的团队或环境收集指标,并将它们与单独的
X-Scope-OrgID
标头一起推送到 Cortex。这实现了每个租户的隔离数据摄取和查询,非常适合托管服务和平台团队。 -
将 Prometheus 覆盖范围扩展到边缘设备:在边缘或物联网设备上部署 Telegraf 以收集系统指标,并将它们发送到集中的 Cortex 集群。即使对于没有本地 Prometheus 抓取器的环境,此方法也能确保一致的可观察性。
-
具有联合租户的全局服务可观察性:通过配置 Telegraf 代理将数据推送到区域 Cortex 集群(每个集群都标记有租户标识符)来聚合来自全局基础设施的指标。Cortex 处理跨区域的重复数据删除和集中访问。
-
自定义应用程序遥测管道:通过 Telegraf 的
exec
或http
输入插件收集特定于应用程序的遥测数据,并将其转发到 Cortex。这使 DevOps 团队能够以可扩展、查询高效的格式监控特定于应用程序的 KPI,同时保持按租户或服务逻辑分组的指标。
反馈
感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法