目录
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法
ECS 是“Elastic Container Service”的缩写,Amazon Elastic Container Service (Amazon ECS) 是一种完全托管的容器编排服务,可让您的容器化环境安全、可靠且可用。它支持 AWS Fargate 等无服务器选项,并与许多 Amazon 服务集成,如 Amazon SageMaker、AWS Batch、Amazon Lex 和 AWS App Mesh。
从更广义的角度来看,Amazon ECS 服务允许您在 Amazon ECS 集群中同时运行和维护特定数量的任务实例。如果需要,这也允许您在负载均衡器后面运行您的服务,这本身就是开发过程的重要组成部分。
为什么使用 Amazon ECS 的 Telegraf 插件?
为了维护 Amazon ECS 和其他 AWS 解决方案的可靠、可用和高性能实例,您需要从 AWS 解决方案的所有组件收集指标和事件。这将使您能够轻松地查明可能导致故障的区域。
本质上,Amazon ECS 的全部意义在于为您提供急需的上下文,以便您不仅知道正在发生什么,而且还知道原因。如果您不仅知道问题已经发生,而且知道导致故障的条件,您就会知道需要做什么来修复它。更重要的是,您还需要知道必须做什么来阻止它再次发生。
Amazon ECS Telegraf 输入插件可帮助您轻松提取指标,让您了解 Amazon ECS 的运行状况。它收集关于集群、任务、内存和 CPU 消耗等指标。将其与众多 Telegraf 插件之一配对以监控容器中的应用程序,您将获得对堆栈的完全可见性。
如何使用 Telegraf 插件监控 Amazon ECS
Amazon ECS Telegraf 插件与 Amazon ECS 和 Amazon Fargate 兼容,并使用 Amazon ECS 元数据和统计信息 v2 或 [v3][task-metadata-endpoint-v3] API 端点来收集 Task 中正在运行的容器的指标。请注意,telegraf 容器必须与它正在检查的工作负载在同一个 Task 中运行。这类似于 Docker 输入插件,但针对 AWS 元数据和统计信息格式进行了一些 ECS 特定的修改。
用于监控的关键 Amazon ECS 指标
与往常一样,您选择监控的 Amazon ECS 指标最终会因您在开发过程中的阶段、您关心的哪些问题或其他与性能相关的问题,甚至您最初开发的应用程序类型而异。话虽如此,您应该主动监控的一些重要的 Amazon ECS 指标包括
- ECS 任务指标
- 标签:
cluster
task_arn
family
revision
id
name
- 字段:
revision (string)
desired_status (string)
known_status (string)
limit_cpu (float)
limit_mem (float)
- 标签:
- ECS 容器指标
- 标签:
cluster
task_arn
family
revision
id
name
- 字段:
container_id
active_anon
active_file
cache
hierarchical_memory_limit
inactive_anon
Inactive_file
mapped_file
pgfault
Pgmajfault
pgpgin
pgpgout
rss
rss_huge
Total_active_anon
total_active_file
total_cache
total_inactive_anon
total_inactive_file
Total_mapped_file
Total_pgfault
Total_pgmajfault
total_pgpgin
total_pgpgout
Total_rss
Total_rss_huge
total_unevictable
Total_writeback
Unevictable
writeback
Fail_count
limit
max_usage
usage
usage_percent
- 标签:
- ECS 容器 CPU 指标
- 标签:
cluster
task_arn
family
revision
id
name
usage_total
usage_in_usermode
usage_in_kernelmode
Usage_system
throttling_periods
throttling_throttled_periods
throttling_throttled_time
usage_percent
usage_total
- 字段:
container_id
- 标签:
- ECS 容器网络指标
- 标签:
cluster
task_arn
family
revision
id
name
- 字段:
container_id
rx_packets
rx_dropped
rx_bytes
rx_errors
tx_packets
tx_dropped
tx_bytes
tx_errors
- 标签:
- ECS 容器 blkio 指标
- 标签:
cluster
task_arn
family
revision
id
name
- 字段:
container_id
io_service_bytes_recursive_async
io_service_bytes_recursive_read
io_service_bytes_recursive_sync
io_service_bytes_recursive_total
io_service_bytes_recursive_write
io_serviced_recursive_async
io_serviced_recursive_read
io_serviced_recursive_sync
io_serviced_recursive_total
io_serviced_recursive_write
- 标签:
- ECS 容器元指标
- 标签:
cluster
task_arn
family
revision
id
name
- 字段:
container_id
docker_name
image
Image_id
desired_status
known_status
Limit_cpu
limit_mem
created_at
started_at
type
- 标签:
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法