目录
输入和输出集成概述
此插件将从 Amazon CloudWatch 拉取指标统计信息,从而简化监控和分析 AWS 资源的过程。
此输出插件通过 HTTP 将指标从 Telegraf 直接流式传输到 ServiceNow MID Server,利用 `nowmetric` 序列化器与 ServiceNow 的 Operational Intelligence 和 Event Management 高效集成。
集成详情
Amazon CloudWatch
Amazon CloudWatch 插件允许用户从 Amazon 的 CloudWatch 服务中拉取详细的指标统计信息。 作为一种监控解决方案,CloudWatch 使用户能够跟踪与 AWS 资源和应用程序相关的各种指标,从而改进运营和性能洞察。 该插件使用结构化身份验证方法,通过结合 STS(安全令牌服务)、共享凭证、环境变量和 EC2 实例配置文件,优先考虑安全性和灵活性,从而确保对 AWS 资源的强大访问控制。 主要功能包括定义特定指标命名空间、指标聚合周期以及可选地包含链接帐户以进行跨帐户监控的功能。 该插件的一个重要方面是它能够处理稀疏和密集指标格式,从而根据用户偏好允许不同的输出结构。 因此,它通过直接从 CloudWatch 提供全面、及时的数据,支持云监控和分析中的各种用例。
ServiceNow
Telegraf 可用于将指标数据直接发送到 ServiceNow MID Server REST 端点。 指标可以使用 ServiceNow 的 Operational Intelligence (OI) 格式或 JSONv2 格式进行格式化,从而实现与 ServiceNow 的 Event Management 和 Operational Intelligence 平台的无缝集成。 序列化器有效地批量处理指标,通过最大限度地减少 HTTP POST 请求的数量来降低网络开销。 这种集成允许用户在 ServiceNow 中快速利用指标来增强可观察性、主动事件管理和性能监控,以及 ServiceNow 的 Operational Intelligence 功能。
配置
Amazon CloudWatch
[[inputs.cloudwatch]]
region = "us-east-1"
# access_key = ""
# secret_key = ""
# token = ""
# role_arn = ""
# web_identity_token_file = ""
# role_session_name = ""
# profile = ""
# shared_credential_file = ""
# include_linked_accounts = false
# endpoint_url = ""
# use_system_proxy = false
# http_proxy_url = "http://localhost:8888"
period = "5m"
delay = "5m"
interval = "5m"
#recently_active = "PT3H"
# cache_ttl = "1h"
namespaces = ["AWS/ELB"]
# metric_format = "sparse"
# ratelimit = 25
# timeout = "5s"
# batch_size = 500
# statistic_include = ["average", "sum", "minimum", "maximum", sample_count]
# statistic_exclude = []
# [[inputs.cloudwatch.metrics]]
# names = ["Latency", "RequestCount"]
# [[inputs.cloudwatch.metrics.dimensions]]
# name = "LoadBalancerName"
# value = "p-example"
ServiceNow
[[outputs.http]]
## ServiceNow MID Server metrics endpoint
url = "http://mid-server.example.com:9082/api/mid/sa/metrics"
## HTTP request method
method = "POST"
## Basic Authentication credentials
username = "evt.integration"
password = "P@$$w0rd!"
## Data serialization format for ServiceNow
data_format = "nowmetric"
## Metric format type: "oi" (default) or "jsonv2"
nowmetric_format = "oi"
## HTTP Headers
[outputs.http.headers]
Content-Type = "application/json"
Accept = "application/json"
## Optional timeout
# timeout = "5s"
## TLS configuration options
# tls_ca = "/etc/telegraf/ca.pem"
# tls_cert = "/etc/telegraf/cert.pem"
# tls_key = "/etc/telegraf/key.pem"
# insecure_skip_verify = false
输入和输出集成示例
Amazon CloudWatch
-
跨账户监控:通过启用 `include_linked_accounts` 选项,利用此插件监控多个 AWS 账户中的资源。 这种情况允许管理多个 AWS 账户的公司将指标聚合到中央监控仪表板中,提供所有指标的统一视图,同时通过适当的角色管理确保安全的数据访问和合规性。
-
动态警报系统:将此插件与警报工具集成,以创建基于 CloudWatch 指标的已定义阈值触发警报的自动化系统。 例如,如果延迟指标超过指定限制,则可以将警报发送到相关团队,从而能够主动响应性能问题并减少停机时间。
-
成本管理仪表板:使用从此插件收集的指标构建成本管理仪表板,该仪表板可视化 AWS 服务使用指标随时间的变化。 通过将这些指标与计费数据相关联,组织可以识别高成本服务,并采取明智的措施来优化其资源使用和支出。
-
应用程序的性能基准测试:利用从 AWS 上运行的应用程序收集的指标来执行性能基准测试。 例如,通过跟踪 ELB 的延迟和请求计数指标,开发人员可以评估应用程序更改对其性能的影响,从而为优化做出数据驱动的决策。
ServiceNow
-
主动事件管理:利用 Telegraf 和 ServiceNow 集成将基础设施和应用程序指标实时流式传输到 ServiceNow Event Management。 根据阈值自动触发事件或补救工作流程,从而显着缩短事件检测和响应时间。
-
端到端应用程序监控:在应用程序堆栈的多个层中部署 Telegraf 代理,将性能指标直接发送到 ServiceNow。 利用 ServiceNow 的 Operational Intelligence,团队可以将跨组件的指标相关联,从而快速识别性能瓶颈。
-
动态 CI 性能跟踪:通过使用此插件推送性能数据,将 Telegraf 指标与 ServiceNow 的 CMDB 集成,从而可以根据实时指标自动更新配置项 (CI) 的运行状况状态。 这确保了 ServiceNow 中基础设施运行状况的准确和当前状态。
-
云资源优化:使用 Telegraf 从混合云和多云基础设施收集指标,直接流式传输到 ServiceNow。 利用这些指标进行实时分析、预测性容量规划和资源优化,从而实现主动管理和降低运营成本。
反馈
感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。