目录
输入和输出集成概述
Zookeeper Telegraf 插件从 Zookeeper 服务器收集和报告指标,从而促进监控和性能分析。它利用“mntr”命令输出收集对于维护 Zookeeper 运行状况至关重要的基本统计信息。
此输出插件通过 HTTP 将来自 Telegraf 的指标直接流式传输到 ServiceNow MID Server,利用 `nowmetric` 序列化器与 ServiceNow 的 Operational Intelligence 和 Event Management 高效集成。
集成详情
Apache Zookeeper
Telegraf 的 Zookeeper 插件旨在通过执行“mntr”命令从 Zookeeper 服务器收集重要统计信息。此插件充当监控工具,捕获与 Zookeeper 性能相关的重要指标,包括连接详细信息、延迟和各种操作统计信息,从而有助于评估 Zookeeper 部署的运行状况和效率。与启用 Prometheus 指标提供程序时推荐的 Prometheus 输入插件相比,Zookeeper 插件访问来自“mntr”命令的原始输出,使其适合不采用 Prometheus 进行指标报告的配置。这种独特的方法允许管理员直接从 Zookeeper 收集 Java Properties 格式的指标,确保全面了解 Zookeeper 的运行状态,并能够及时响应性能异常。它在 Zookeeper 作为集中式服务运行以维护分布式系统的配置信息和名称的环境中尤其出色,从而提供对于故障排除和容量规划至关重要的不可估量的见解。
ServiceNow
Telegraf 可用于将指标数据直接发送到 ServiceNow MID Server REST 端点。指标可以使用 ServiceNow 的 Operational Intelligence (OI) 格式或 JSONv2 格式进行格式化,从而实现与 ServiceNow 的 Event Management 和 Operational Intelligence 平台的无缝集成。序列化器有效地批量处理指标,通过最大限度地减少 HTTP POST 请求的数量来降低网络开销。此集成允许用户在 ServiceNow 中快速利用指标,以增强可观察性、主动事件管理和性能监控,并利用 ServiceNow 的 Operational Intelligence 功能。
配置
Apache Zookeeper
[[inputs.zookeeper]]
## An array of address to gather stats about. Specify an ip or hostname
## with port. ie localhost:2181, 10.0.0.1:2181, etc.
## If no servers are specified, then localhost is used as the host.
## If no port is specified, 2181 is used
servers = [":2181"]
## Timeout for metric collections from all servers. Minimum timeout is "1s".
# timeout = "5s"
## Float Parsing - the initial implementation forced any value unable to be
## parsed as an int to be a string. Setting this to "float" will attempt to
## parse float values as floats and not strings. This would break existing
## metrics and may cause issues if a value switches between a float and int.
# parse_floats = "string"
## Optional TLS Config
# enable_tls = false
# tls_ca = "/etc/telegraf/ca.pem"
# tls_cert = "/etc/telegraf/cert.pem"
# tls_key = "/etc/telegraf/key.pem"
## If false, skip chain & host verification
# insecure_skip_verify = true
ServiceNow
[[outputs.http]]
## ServiceNow MID Server metrics endpoint
url = "http://mid-server.example.com:9082/api/mid/sa/metrics"
## HTTP request method
method = "POST"
## Basic Authentication credentials
username = "evt.integration"
password = "P@$$w0rd!"
## Data serialization format for ServiceNow
data_format = "nowmetric"
## Metric format type: "oi" (default) or "jsonv2"
nowmetric_format = "oi"
## HTTP Headers
[outputs.http.headers]
Content-Type = "application/json"
Accept = "application/json"
## Optional timeout
# timeout = "5s"
## TLS configuration options
# tls_ca = "/etc/telegraf/ca.pem"
# tls_cert = "/etc/telegraf/cert.pem"
# tls_key = "/etc/telegraf/key.pem"
# insecure_skip_verify = false
输入和输出集成示例
Apache Zookeeper
-
集群健康监控:集成 Zookeeper 插件以监控依赖 Zookeeper 进行配置管理和服务发现的分布式应用程序的运行状况和性能。通过跟踪会话计数、延迟和数据大小等指标,DevOps 团队可以在潜在问题升级之前识别它们,从而确保跨应用程序的高可用性和可靠性。
-
性能基准:利用该插件在不同的工作负载场景中对 Zookeeper 性能进行基准测试。这不仅有助于了解 Zookeeper 在负载下的行为方式,还有助于调整配置以优化吞吐量并减少高峰操作期间的延迟。
-
异常告警:将此插件与告警工具结合使用,创建一个主动监控系统,如果特定的 Zookeeper 指标超过阈值限制(例如打开的文件描述符计数或高延迟值),该系统会通知工程师。这使团队能够及时响应可能影响服务可靠性的问题。
-
历史数据分析:将 Zookeeper 插件收集的指标存储在时序数据库中,以分析历史性能趋势。这使团队能够评估随时间变化的影响,评估扩展操作的有效性,并为未来的容量需求进行规划。
ServiceNow
-
主动事件管理:利用 Telegraf 和 ServiceNow 集成将基础设施和应用程序指标实时流式传输到 ServiceNow Event Management。根据阈值自动触发事件或补救工作流程,从而显着缩短事件检测和响应时间。
-
端到端应用程序监控:在应用程序堆栈的多个层部署 Telegraf 代理,将性能指标直接发送到 ServiceNow。利用 ServiceNow 的 Operational Intelligence,团队可以将跨组件的指标关联起来,快速识别性能瓶颈。
-
动态 CI 性能跟踪:通过使用此插件推送性能数据,将 Telegraf 指标与 ServiceNow 的 CMDB 集成,从而可以根据实时指标自动更新配置项 (CI) 的健康状态。这确保了 ServiceNow 中基础设施健康状态的准确性和当前性。
-
云资源优化:使用 Telegraf 从混合云和多云基础设施收集指标,直接流式传输到 ServiceNow。利用这些指标进行实时分析、预测性容量规划和资源优化,从而实现主动管理并降低运营成本。
反馈
感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现了任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。