中断监控

免费使用此InfluxDB集成

中断请求(或IRQ)是发送到处理器的信号,该信号暂时停止正在运行的程序,并允许运行中断处理器。您可能想监控IRQ,因为它们可能导致CPU使用率过高,这可能对您的应用程序/环境的性能产生重大影响。

为什么使用中断的Telegraf插件?

中断是由硬件或软件通过IRQ发送的信号。

中断可能由多种原因引起,可以暂时停止正在运行的程序的执行,并调用一个称为中断处理器或ISR(中断服务例程)的特殊程序。使用中断Telegraf插件监控中断可以帮助您了解您的环境或应用程序中的问题所在 - 尤其是与CPU/内存利用率、磁盘等其他关键系统指标结合使用时。

如何使用Telegraf插件监控中断

中断Telegraf输入插件从/proc/interrupts/proc/softirqs收集关于IRQ的指标。当设置为true时,cpu指标会标记为cpu。否则,cpu存储为字段。要筛选要收集的IRQ,请使用tagpass / tagdrop,即[inputs.interrupts.tagdrop]irq = [ "NET_RX", "TASKLET" ]

用于监控的关键中断指标

以下是一些您应积极监控的重要中断指标

使用cpu_as_tag = false

  • interrupts
    • tags
    • irq (IRQ名称)
    • type
    • device (位于IRQ的设备的名称)
    • cpu
  • fields
    • cpu (int,每个cpu的中断数)
    • total (int,中断总数)
  • soft_interrupts
    • tags
      • irq (IRQ名称)
      • type
      • device (位于IRQ的设备的名称)
      • cpu
    • fields
      • cpu (int,每个cpu的中断数)
      • total (int,中断总数)

使用cpu_as_tag = true

  • interrupts
    • tags
      • irq (IRQ名称)
      • type
      • device (位于IRQ的设备的名称)
      • cpu
    • fields
      • count (int,中断数)
  • soft_interrupts
    • tags
      • irq (IRQ名称)
      • type
      • device (位于IRQ的设备的名称)
      • cpu
    • fields
      • count (int,中断数)
有关更多信息,请参阅文档。

项目URL   文档

相关资源

InfluxDb-cloud-logo

最强大的时间序列
数据库作为服务

免费开始
Influxdbu

开发者教育

时间序列应用程序开发人员的培训。

查看所有教育