Apache Aurora 调度器监控

免费使用此 InfluxDB 集成

Apache Aurora 的核心是一个用于长时间运行服务、应用程序和 cron 作业的框架。除了负责在共享机器池中运行应用程序和服务外,Aurora 还负责确保它们始终运行——无论发生什么情况。即使涉及的一些机器开始出现故障,Aurora 也能够智能地将这些作业重新调度到健康的机器上,从而保证整体性能和完整性。

在更新作业时,Aurora 还会检测部署的健康状况和状态,并在必要时自动回滚到更稳定的状态。Aurora 还包括一个创新的配额系统,可以帮助为所有特定的关键应用程序提供保证资源。它甚至可以支持多用户部署服务。

为什么使用 Apache Aurora 的 Telegraf 插件?

Apache Aurora Telegraf 插件旨在收集您 Apache Aurora 调度器上的所有重要指标,并以视觉方式组织这些指标,使您的组织中任何人都能轻松理解。不仅如此,它还是一个一站式的商店,提供所有基本指标和相关数据,这样您就可以轻松访问所需的信息,以便在特定情况下做出最佳决策。

如何使用 Telegraf 插件监控 Apache Aurora

幸运的是,配置 Apache Aurora Telegraf 插件的过程非常简单。您可以使用 inputs.aurora 插件 ID 非常简单地添加它。然后它将收集您从任何可用的 Apache Aurora 调度器中选择的任何指标。请注意,调度器本身将通过其内置的 HTTP 接口公开大量仪表数据。要快速了解任何时刻的确切情况,请使用以下命令

$ vagrant ssh -c 'curl -s localhost:8081/vars | head'

您可以使用 Apache Aurora Telegraf 插件收集的一些可用指标包括超时、基本身份验证以及可选的 TLS 配置。

一旦您正确设置了 Apache Aurora Telegraf 插件,您就可以立即开始将指标放入您的 InfluxDB 实例以进行进一步审查。

用于监控的 Apache Aurora 关键指标

如前所述,Apache Aurora Telegraf 插件非常灵活——这意味着您可以根据需要主动监控部署的许多不同元素。其中一些包括

  • 标签,包括调度器的 URL 和角色(表示它是否是领导者或跟随者)。
  • 字段。这些是从 /vars 端点收集的数值指标。请注意,在此过程中实际上不会收集字符串字段。
  • JVM_uptime_secs。这允许您看到 JVM 进程已运行的秒数。
  • System_load_avg。这显示了系统当前的负载平均,数据来源于过去一分钟内收集的数据。
  • Process_CPU_cores_utilized。这显示了JVM进程当前使用的CPU核心数量。请注意,为了获得最佳结果,这个数字不应该超过机器上实际存在的逻辑CPU核心数量。
更多信息,请查看文档。

项目URL   文档

相关资源

InfluxDb-cloud-logo

最强大的时间序列
数据库作为服务

免费开始
Influxdbu

开发者教育

时间序列应用程序开发者的培训。

查看所有教育内容