目录
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法
ECS 是“Elastic Container Service”的缩写,Amazon Elastic Container Service (Amazon ECS) 是一种完全托管的容器编排服务,可让您的容器化环境安全、可靠且可用。它支持 AWS Fargate 等无服务器选项,并与许多 Amazon 服务集成,如 Amazon SageMaker、AWS Batch、Amazon Lex 和 AWS App Mesh。
从更广义的角度来看,Amazon ECS 服务允许您在 Amazon ECS 集群中同时运行和维护特定数量的任务实例。如果需要,这也允许您在负载均衡器后面运行您的服务,这本身就是开发过程的重要组成部分。
为什么使用 Amazon ECS 的 Telegraf 插件?
为了维护 Amazon ECS 和其他 AWS 解决方案的可靠、可用和高性能实例,您需要从 AWS 解决方案的所有组件收集指标和事件。这将使您能够轻松地查明可能导致故障的区域。
本质上,Amazon ECS 的全部意义在于为您提供急需的上下文,以便您不仅知道正在发生什么,而且还知道原因。如果您不仅知道问题已经发生,而且知道导致故障的条件,您就会知道需要做什么来修复它。更重要的是,您还需要知道必须做什么来阻止它再次发生。
Amazon ECS Telegraf 输入插件可帮助您轻松提取指标,让您了解 Amazon ECS 的运行状况。它收集关于集群、任务、内存和 CPU 消耗等指标。将其与众多 Telegraf 插件之一配对以监控容器中的应用程序,您将获得对堆栈的完全可见性。
如何使用 Telegraf 插件监控 Amazon ECS
Amazon ECS Telegraf 插件与 Amazon ECS 和 Amazon Fargate 兼容,并使用 Amazon ECS 元数据和统计信息 v2 或 [v3][task-metadata-endpoint-v3] API 端点来收集 Task 中正在运行的容器的指标。请注意,telegraf 容器必须与它正在检查的工作负载在同一个 Task 中运行。这类似于 Docker 输入插件,但针对 AWS 元数据和统计信息格式进行了一些 ECS 特定的修改。
用于监控的关键 Amazon ECS 指标
与往常一样,您选择监控的 Amazon ECS 指标最终会因您在开发过程中的阶段、您关心的哪些问题或其他与性能相关的问题,甚至您最初开发的应用程序类型而异。话虽如此,您应该主动监控的一些重要的 Amazon ECS 指标包括
- ECS 任务指标
- 标签:
clustertask_arnfamilyrevisionidname - 字段:
revision (string)desired_status (string)known_status (string)limit_cpu (float)limit_mem (float)
- 标签:
- ECS 容器指标
- 标签:
clustertask_arnfamilyrevisionidname - 字段:
container_idactive_anonactive_filecachehierarchical_memory_limitinactive_anonInactive_filemapped_filepgfault Pgmajfaultpgpginpgpgoutrssrss_hugeTotal_active_anontotal_active_filetotal_cachetotal_inactive_anontotal_inactive_fileTotal_mapped_fileTotal_pgfaultTotal_pgmajfaulttotal_pgpgintotal_pgpgoutTotal_rssTotal_rss_hugetotal_unevictableTotal_writebackUnevictablewritebackFail_countlimitmax_usageusageusage_percent
- 标签:
- ECS 容器 CPU 指标
- 标签:
clustertask_arnfamilyrevisionidnameusage_totalusage_in_usermodeusage_in_kernelmode Usage_systemthrottling_periodsthrottling_throttled_periodsthrottling_throttled_timeusage_percentusage_total- 字段:
container_id
- 标签:
- ECS 容器网络指标
- 标签:
clustertask_arnfamilyrevisionidname - 字段:
container_idrx_packetsrx_droppedrx_bytesrx_errorstx_packetstx_droppedtx_bytestx_errors
- 标签:
- ECS 容器 blkio 指标
- 标签:
clustertask_arnfamilyrevisionidname - 字段:
container_idio_service_bytes_recursive_asyncio_service_bytes_recursive_readio_service_bytes_recursive_syncio_service_bytes_recursive_totalio_service_bytes_recursive_writeio_serviced_recursive_asyncio_serviced_recursive_readio_serviced_recursive_syncio_serviced_recursive_totalio_serviced_recursive_write
- 标签:
- ECS 容器元指标
- 标签:
clustertask_arnfamilyrevisionidname - 字段:
container_iddocker_nameimageImage_iddesired_statusknown_statusLimit_cpulimit_memcreated_atstarted_attype
- 标签:
强大的性能,无限的扩展能力
收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它都更有价值。InfluxDB 是排名第一的时间序列平台,旨在与 Telegraf 一起扩展。
查看入门方法