目录
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法
输入和输出集成概览
此插件允许用户从分布式环境中的 Hashicorp Nomad 代理收集指标。
此插件使 Telegraf 能够使用 Prometheus remote write 协议将指标发送到 Cortex,从而实现无缝摄取到 Cortex 的可扩展、多租户时间序列存储中。
集成详细信息
Hashicorp Nomad
Hashicorp Nomad 输入插件旨在从集群中的每个 Nomad 代理收集指标。通过在每个节点上部署 Telegraf,它可以连接到本地 Nomad 代理,通常在 ‘http://127.0.0.1:4646’ 上可用。通过这种设置,用户可以系统地收集和监控与其 Nomad 环境的性能和状态相关的指标,确保他们保持集群运行状态的健康和高效。此插件可以洞察 Nomad 的运行方面,这对于维护可靠的云基础设施至关重要。
Cortex
借助 Telegraf 的 HTTP 输出插件和 prometheusremotewrite
数据格式,您可以将指标直接发送到 Cortex,这是一个用于 Prometheus 的水平可扩展的长期存储后端。Cortex 支持多租户,并接受使用 Prometheus protobuf 格式的 remote write 请求。通过使用 Telegraf 作为收集代理和 Remote Write 作为传输机制,组织可以将可观测性扩展到 Prometheus 本身不支持的来源(例如 Windows 主机、支持 SNMP 的设备或自定义应用程序指标),同时利用 Cortex 的高可用性和长期保留能力。
配置
Hashicorp Nomad
[[inputs.nomad]]
## URL for the Nomad agent
# url = "http://127.0.0.1:4646"
## Set response_timeout (default 5 seconds)
# response_timeout = "5s"
## Optional TLS Config
# tls_ca = /path/to/cafile
# tls_cert = /path/to/certfile
# tls_key = /path/to/keyfile
Cortex
[[outputs.http]]
## Cortex Remote Write endpoint
url = "http://cortex.example.com/api/v1/push"
## Use POST to send data
method = "POST"
## Send metrics using Prometheus remote write format
data_format = "prometheusremotewrite"
## Optional HTTP headers for authentication
# [outputs.http.headers]
# X-Scope-OrgID = "your-tenant-id"
# Authorization = "Bearer YOUR_API_TOKEN"
## Optional TLS configuration
# tls_ca = "/path/to/ca.pem"
# tls_cert = "/path/to/cert.pem"
# tls_key = "/path/to/key.pem"
# insecure_skip_verify = false
## Request timeout
timeout = "10s"
输入和输出集成示例
Hashicorp Nomad
-
集群健康状况监控:使用 Hashicorp Nomad 插件聚合 Nomad 部署中所有节点的指标。通过监控健康状况指标(例如分配状态、作业性能和资源利用率),运营团队可以深入了解其部署的整体健康状况,快速识别和解决问题,并根据实时数据优化资源分配。
-
作业执行的性能分析:利用 Nomad 提供的指标来分析作业执行时间和资源消耗。此用例使开发人员能够有效地调整作业参数、优化任务性能并说明随时间变化的趋势,最终提高效率并降低资源分配成本。
-
关键状况警报:根据从 Nomad 代理抓取的指标实施警报机制。通过为 CPU 使用率或失败的作业分配等关键指标设置阈值,团队可以在潜在问题升级之前主动响应,从而确保在 Nomad 平台上运行的应用程序具有更高的正常运行时间和可靠性。
-
与可视化工具集成:使用 Hashicorp Nomad 插件收集的数据来馈送到可视化工具以实现实时仪表板。此设置使团队能够一目了然地监控集群工作负载、作业状态和系统性能,从而根据对 Nomad 环境的可视化洞察力促进更好的决策和战略规划。
Cortex
-
统一的多租户监控:使用 Telegraf 从不同的团队或环境收集指标,并将它们与单独的
X-Scope-OrgID
标头一起推送到 Cortex。这支持每个租户的隔离数据摄取和查询,非常适合托管服务和平台团队。 -
将 Prometheus 覆盖范围扩展到边缘设备:在边缘或物联网设备上部署 Telegraf 以收集系统指标并将它们发送到集中式 Cortex 集群。即使对于没有本地 Prometheus 抓取器的环境,此方法也能确保一致的可观测性。
-
具有联合租户的全局服务可观测性:通过配置 Telegraf 代理将数据推送到区域 Cortex 集群(每个集群都标记有租户标识符)来聚合来自全局基础设施的指标。Cortex 处理跨区域的重复数据删除和集中访问。
-
自定义应用程序遥测管道:通过 Telegraf 的
exec
或http
输入插件收集特定于应用程序的遥测数据,并将其转发到 Cortex。这使 DevOps 团队能够以可扩展、查询高效的格式监控特定于应用程序的 KPI,同时保持按租户或服务逻辑分组的指标。
反馈
感谢您成为我们社区的一份子!如果您有任何一般反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提供意见。请在 InfluxDB 社区 Slack 中提交您的反馈。
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法