中断监控
免费使用此InfluxDB集成中断请求(或IRQ)是发送到处理器的信号,该信号暂时停止正在运行的程序,并允许运行中断处理器。您可能想监控IRQ,因为它们可能导致CPU使用率过高,这可能对您的应用程序/环境的性能产生重大影响。
为什么使用中断的Telegraf插件?
中断是由硬件或软件通过IRQ发送的信号。
中断可能由多种原因引起,可以暂时停止正在运行的程序的执行,并调用一个称为中断处理器或ISR(中断服务例程)的特殊程序。使用中断Telegraf插件监控中断可以帮助您了解您的环境或应用程序中的问题所在 - 尤其是与CPU/内存利用率、磁盘等其他关键系统指标结合使用时。
如何使用Telegraf插件监控中断
中断Telegraf输入插件从/proc/interrupts
和/proc/softirqs
收集关于IRQ的指标。当设置为true时,cpu指标会标记为cpu。否则,cpu存储为字段。要筛选要收集的IRQ,请使用tagpass / tagdrop,即[inputs.interrupts.tagdrop]
和irq = [ "NET_RX", "TASKLET" ]
用于监控的关键中断指标
以下是一些您应积极监控的重要中断指标
使用cpu_as_tag = false
- interrupts
- tags
- irq (IRQ名称)
- type
- device (位于IRQ的设备的名称)
- cpu
- fields
- cpu (int,每个cpu的中断数)
- total (int,中断总数)
- soft_interrupts
- tags
- irq (IRQ名称)
- type
- device (位于IRQ的设备的名称)
- cpu
- fields
- cpu (int,每个cpu的中断数)
- total (int,中断总数)
- tags
使用cpu_as_tag = true
- interrupts
- tags
- irq (IRQ名称)
- type
- device (位于IRQ的设备的名称)
- cpu
- fields
- count (int,中断数)
- tags
- soft_interrupts
- tags
- irq (IRQ名称)
- type
- device (位于IRQ的设备的名称)
- cpu
- fields
- count (int,中断数)
- tags
有关更多信息,请参阅文档。