Amazon ECS 指标

强大的性能和简易的集成,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

50 亿+

Telegraf 下载量

#1

时间序列数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

ECS 是“Elastic Container Service”的缩写,Amazon Elastic Container Service (Amazon ECS) 是一种完全托管的容器编排服务,可让您的容器化环境安全、可靠且可用。它支持 AWS Fargate 等无服务器选项,并与许多 Amazon 服务集成,如 Amazon SageMaker、AWS Batch、Amazon Lex 和 AWS App Mesh。

从更广义的角度来看,Amazon ECS 服务允许您在 Amazon ECS 集群中同时运行和维护特定数量的任务实例。如果需要,这也允许您在负载均衡器后面运行您的服务,这本身就是开发过程的重要组成部分。

为什么使用 Amazon ECS 的 Telegraf 插件?

为了维护 Amazon ECS 和其他 AWS 解决方案的可靠、可用和高性能实例,您需要从 AWS 解决方案的所有组件收集指标和事件。这将使您能够轻松地查明可能导致故障的区域。

本质上,Amazon ECS 的全部意义在于为您提供急需的上下文,以便您不仅知道正在发生什么,而且还知道原因。如果您不仅知道问题已经发生,而且知道导致故障的条件,您就会知道需要做什么来修复它。更重要的是,您还需要知道必须做什么来阻止它再次发生。

Amazon ECS Telegraf 输入插件可帮助您轻松提取指标,让您了解 Amazon ECS 的运行状况。它收集关于集群、任务、内存和 CPU 消耗等指标。将其与众多 Telegraf 插件之一配对以监控容器中的应用程序,您将获得对堆栈的完全可见性。

如何使用 Telegraf 插件监控 Amazon ECS

Amazon ECS Telegraf 插件与 Amazon ECS 和 Amazon Fargate 兼容,并使用 Amazon ECS 元数据和统计信息 v2[v3][task-metadata-endpoint-v3] API 端点来收集 Task 中正在运行的容器的指标。请注意,telegraf 容器必须与它正在检查的工作负载在同一个 Task 中运行。这类似于 Docker 输入插件,但针对 AWS 元数据和统计信息格式进行了一些 ECS 特定的修改。

用于监控的关键 Amazon ECS 指标

与往常一样,您选择监控的 Amazon ECS 指标最终会因您在开发过程中的阶段、您关心的哪些问题或其他与性能相关的问题,甚至您最初开发的应用程序类型而异。话虽如此,您应该主动监控的一些重要的 Amazon ECS 指标包括

  • ECS 任务指标
    • 标签:cluster task_arn family revision id name
    • 字段:revision (string) desired_status (string) known_status (string) limit_cpu (float) limit_mem (float)
  • ECS 容器指标
    • 标签:cluster task_arn family revision id name
    • 字段:container_id active_anon active_file cache hierarchical_memory_limit inactive_anon Inactive_file mapped_file pgfault
    • Pgmajfault pgpgin pgpgout rss rss_huge
    • Total_active_anon total_active_file total_cache total_inactive_anon total_inactive_file Total_mapped_file Total_pgfault Total_pgmajfault total_pgpgin total_pgpgout Total_rss Total_rss_huge total_unevictable Total_writeback Unevictable writeback Fail_count limit max_usage usage usage_percent
  • ECS 容器 CPU 指标
    • 标签:cluster task_arn family revision id name usage_total usage_in_usermode usage_in_kernelmode
    • Usage_system throttling_periods throttling_throttled_periods throttling_throttled_time usage_percent usage_total
    • 字段:container_id
  • ECS 容器网络指标
    • 标签:cluster task_arn family revision id name
    • 字段:container_id rx_packets rx_dropped rx_bytes rx_errors tx_packets tx_dropped tx_bytes tx_errors
  • ECS 容器 blkio 指标
    • 标签:cluster task_arn family revision id name
    • 字段:container_id io_service_bytes_recursive_async io_service_bytes_recursive_read io_service_bytes_recursive_sync io_service_bytes_recursive_total io_service_bytes_recursive_write io_serviced_recursive_async io_serviced_recursive_read io_serviced_recursive_sync io_serviced_recursive_total io_serviced_recursive_write
  • ECS 容器元指标
    • 标签:cluster task_arn family revision id name
    • 字段:container_id docker_name image Image_id desired_status known_status Limit_cpu limit_mem created_at started_at type
有关更多信息,请查看文档。

项目 URL   文档

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成