目录
输入和输出集成概述
此插件将从 Amazon CloudWatch 拉取指标统计信息,从而简化监控和分析 AWS 资源的过程。
此插件使用 HTTP 将 Telegraf 指标直接发送到 Grafana 的 Mimir 数据库,为 Prometheus 兼容指标提供可扩展且高效的长期存储和分析。
集成详情
Amazon CloudWatch
Amazon CloudWatch 插件允许用户从 Amazon 的 CloudWatch 服务拉取详细的指标统计信息。 作为一种监控解决方案,CloudWatch 使用户能够跟踪与 AWS 资源和应用程序相关的各种指标,从而改进运营和性能洞察。 该插件使用结构化身份验证方法,通过 STS(安全令牌服务)、共享凭证、环境变量和 EC2 实例配置文件的组合,优先考虑安全性和灵活性,确保对 AWS 资源的强大访问控制。 主要功能包括定义特定指标命名空间、指标聚合周期以及可选包含关联帐户以进行跨帐户监控的功能。 此插件的一个重要方面是它能够处理稀疏和密集指标格式,从而允许根据用户偏好使用不同的输出结构。 因此,它通过直接从 CloudWatch 提供全面、及时的数据,支持云监控和分析中的各种用例。
Mimir
Grafana Mimir 支持 Prometheus Remote Write 协议,使 Telegraf 收集的指标能够高效地摄取到 Mimir 集群中,以实现大规模长期存储。 此集成利用 Prometheus 成熟的标准,允许用户将 Telegraf 广泛的数据收集功能与 Mimir 的高级功能(例如查询联合、多租户、高可用性和经济高效的存储)相结合。 Grafana Mimir 的架构经过优化,可处理大量指标数据并提供快速查询响应,使其成为复杂监控环境和分布式系统的理想选择。
配置
Amazon CloudWatch
[[inputs.cloudwatch]]
region = "us-east-1"
# access_key = ""
# secret_key = ""
# token = ""
# role_arn = ""
# web_identity_token_file = ""
# role_session_name = ""
# profile = ""
# shared_credential_file = ""
# include_linked_accounts = false
# endpoint_url = ""
# use_system_proxy = false
# http_proxy_url = "http://localhost:8888"
period = "5m"
delay = "5m"
interval = "5m"
#recently_active = "PT3H"
# cache_ttl = "1h"
namespaces = ["AWS/ELB"]
# metric_format = "sparse"
# ratelimit = 25
# timeout = "5s"
# batch_size = 500
# statistic_include = ["average", "sum", "minimum", "maximum", sample_count]
# statistic_exclude = []
# [[inputs.cloudwatch.metrics]]
# names = ["Latency", "RequestCount"]
# [[inputs.cloudwatch.metrics.dimensions]]
# name = "LoadBalancerName"
# value = "p-example"
Mimir
[[outputs.http]]
url = "http://data-load-balancer-backend-1:9009/api/v1/push"
data_format = "prometheusremotewrite"
username = "*****"
password = "******"
[outputs.http.headers]
Content-Type = "application/x-protobuf"
Content-Encoding = "snappy"
X-Scope-OrgID = "****"
输入和输出集成示例
Amazon CloudWatch
-
跨帐户监控:通过启用
include_linked_accounts
选项,利用此插件监控多个 AWS 帐户中的资源。 这种情况允许管理多个 AWS 帐户的公司将指标聚合到中央监控仪表板中,从而提供所有指标的统一视图,同时通过适当的角色管理确保安全的数据访问和合规性。 -
动态警报系统:将此插件与警报工具集成,以创建自动系统,该系统根据 CloudWatch 指标的已定义阈值触发警报。 例如,如果延迟指标超出指定限制,则可以将警报发送给相关团队,从而能够主动响应性能问题并减少停机时间。
-
成本管理仪表板:使用从插件收集的指标来构建成本管理仪表板,该仪表板可视化 AWS 服务随时间的使用指标。 通过将这些指标与计费数据相关联,组织可以识别高成本服务,并采取明智的措施来优化其资源使用和支出。
-
应用程序的性能基准测试:利用从 AWS 上运行的应用程序收集的指标来执行性能基准测试。 例如,通过跟踪 ELB 的延迟和请求计数指标,开发人员可以评估应用程序更改对其性能的影响,从而做出数据驱动的优化决策。
Mimir
-
企业级 Kubernetes 监控:将 Telegraf 与 Grafana Mimir 集成,以企业级规模流式传输来自 Kubernetes 集群的指标。 这实现了全面的可见性、改进的资源分配以及跨数百个集群的主动故障排除,利用了 Mimir 的横向可扩展性和高可用性。
-
多租户 SaaS 应用程序可观测性:使用此插件将来自不同 SaaS 租户的指标集中到 Grafana Mimir 中,从而根据资源使用情况实现租户隔离和准确计费。 这种方法提供可靠的可观测性、高效的成本管理和安全的多租户支持。
-
全球边缘网络性能跟踪:将来自全球分布式边缘服务器的延迟和可用性指标流式传输到 Grafana Mimir。 组织可以快速识别性能下降或中断,利用 Mimir 的快速查询功能来确保最佳的服务可靠性和用户体验。
-
高容量微服务的实时分析:在高容量微服务架构中实施 Telegraf 指标收集,将数据馈送到 Grafana Mimir 以进行实时分析和异常检测。 Mimir 强大的查询功能使团队能够检测异常并快速响应,从而保持高服务可用性和性能。
反馈
感谢您成为我们社区的一份子! 如果您对这些页面有任何一般性反馈或发现任何错误,我们欢迎并鼓励您提供意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。