目录
强大的性能,无限的扩展
收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它都更有价值。 使用 InfluxDB,第一名的时序平台,它与 Telegraf 一起构建以实现扩展。
查看入门方法
输入和输出集成概述
DNS 插件使用户能够监控和收集 DNS 查询时间的统计信息,从而方便 DNS 解析的性能分析。
此插件使 Telegraf 能够使用 Prometheus 远程写入协议将指标发送到 Cortex,从而可以无缝地摄取到 Cortex 的可扩展、多租户时序存储中。
集成详情
DNS
此插件以毫秒为单位收集 DNS 查询时间,利用类似于 Dig 命令的 DNS 查询功能。 它提供了一种通过测量来自指定 DNS 服务器的响应时间来监控和分析 DNS 性能的方法,使网络管理员和工程师能够确保最佳 DNS 解析时间。 该插件可以配置为针对特定服务器并自定义查询的记录类型,涵盖各种 DNS 功能,例如将域名解析为 IP 地址,或根据需要从特定记录中检索详细信息,同时还清楚地报告每次查询的成功或失败,以及相关的元数据。
Cortex
借助 Telegraf 的 HTTP 输出插件和 prometheusremotewrite 数据格式,您可以将指标直接发送到 Cortex,Cortex 是 Prometheus 的水平可扩展长期存储后端。 Cortex 支持多租户,并使用 Prometheus protobuf 格式接受远程写入请求。 通过使用 Telegraf 作为收集代理,并使用 Remote Write 作为传输机制,组织可以将可观测性扩展到 Prometheus 本身不支持的来源(例如 Windows 主机、支持 SNMP 的设备或自定义应用程序指标),同时利用 Cortex 的高可用性和长期保留能力。
配置
DNS
[[inputs.dns_query]]
servers = ["8.8.8.8"]
# network = "udp"
# domains = ["."]
# record_type = "A"
# port = 53
# timeout = "2s"
# include_fields = []
Cortex
[[outputs.http]]
## Cortex Remote Write endpoint
url = "http://cortex.example.com/api/v1/push"
## Use POST to send data
method = "POST"
## Send metrics using Prometheus remote write format
data_format = "prometheusremotewrite"
## Optional HTTP headers for authentication
# [outputs.http.headers]
# X-Scope-OrgID = "your-tenant-id"
# Authorization = "Bearer YOUR_API_TOKEN"
## Optional TLS configuration
# tls_ca = "/path/to/ca.pem"
# tls_cert = "/path/to/cert.pem"
# tls_key = "/path/to/key.pem"
# insecure_skip_verify = false
## Request timeout
timeout = "10s"
输入和输出集成示例
DNS
-
监控多个服务器的 DNS 性能:通过部署 DNS 插件,用户可以通过在 servers 数组中指定不同的 DNS 服务器(例如 Google DNS 和 Cloudflare DNS)来同时监控它们的性能。 这种情况可以比较不同 DNS 提供商之间的响应时间和可靠性,从而帮助根据经验数据选择最佳选项。
-
分析高流量域的查询时间:集成插件以专门测量与组织运营相关的高流量域(例如内部服务或面向客户的站点)的响应时间。 通过关注这些域的性能指标,组织可以主动解决延迟问题,确保服务可靠性并改善用户体验。
-
DNS 超时警报:将插件与警报系统结合使用,以便在 DNS 查询超过定义的超时阈值时通知管理员。 这种设置有助于主动排除网络问题或服务器配置错误,从而对潜在的停机情况做出快速响应。
-
收集历史数据以了解性能趋势:使用插件收集较长时期内 DNS 查询时间的历史数据。 此数据可用于分析 DNS 性能的趋势和模式,从而更好地进行容量规划、识别周期性问题,并为基础设施升级或更改 DNS 架构提供依据。
Cortex
-
统一多租户监控:使用 Telegraf 从不同的团队或环境收集指标,并使用单独的 X-Scope-OrgID 标头将它们推送到 Cortex。 这实现了每个租户的隔离数据摄取和查询,非常适合托管服务和平台团队。
-
将 Prometheus 覆盖范围扩展到边缘设备:在边缘或物联网设备上部署 Telegraf 以收集系统指标,并将它们发送到集中的 Cortex 集群。 即使对于没有本地 Prometheus 抓取器的环境,此方法也能确保一致的可观测性。
-
通过联邦租户实现全球服务可观测性:通过配置 Telegraf 代理将数据推送到区域 Cortex 集群(每个集群都标有租户标识符)来聚合来自全球基础设施的指标。 Cortex 处理跨区域的重复数据删除和集中访问。
-
自定义应用遥测管道:通过 Telegraf 的 exec 或 http 输入插件收集特定于应用的遥测数据,并将其转发到 Cortex。 这使 DevOps 团队能够以可扩展、查询高效的格式监控特定于应用的 KPI,同时保持指标按租户或服务进行逻辑分组。
反馈
感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现了任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。
强大的性能,无限的扩展
收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它都更有价值。 使用 InfluxDB,第一名的时序平台,它与 Telegraf 一起构建以实现扩展。
查看入门方法