Bond接口监控
免费使用此InfluxDB集成通常,网络聚合是指在一台主机上将网络接口组合在一起的过程,目的是为了冗余和/或增加吞吐量。这在虚拟化环境中尤为重要,因为冗余是一个关键因素。显然,你希望尽一切可能保护虚拟化环境免受单点故障或物理链路故障导致的停机服务。网络聚合在这方面起到了重要作用。
网络聚合不仅有助于增加网络吞吐量和带宽,而且在实现容错、负载均衡网络等方面也非常理想。这不要与“团队”概念混淆,团队实际上是通过单独提供的驱动程序实现网络聚合的新方法。
为什么使用Telegraf插件进行聚合?
聚合网络可以增加用户网络的吞吐量,因此了解这些聚合接口的当前状态对于确保向用户提供性能保证非常重要。
通过关注正常工作条件下的情况,你还可以使自己处于一个更好的位置,以便更快地识别任何开始超出那些“默认”边界的情况。这种洞察力可以帮助你及时发现并解决小问题,从而防止它成为未来更大(可能更具破坏性)的问题。
Bond Telegraf插件收集指标,让您了解哪个接口是活动的,聚合接口的状态,以及是否存在任何故障。了解这些信息将帮助您维护这些接口,从而保持对客户的SLA承诺。此外,您可以将这些指标与来自其他Telegraf插件(如SNMP、NetFlow和Cisco gRPC网络管理接口(gNMI))收集的指标结合,以获得网络健康的全面视图。
如何使用Telegraf插件监控聚合
默认情况下,Bond Telegraf插件收集所有聚合接口的指标,但您可以将指标限制在指定的聚合接口上。
要正确配置Bond Telegraf插件,请使用以下命令。请注意,您需要根据您的部署替换默认值。
[[inputs.bond]] ## Sets 'proc' directory path ## If not specified, then default is /proc # host_proc = "/proc" ## By default, telegraf gather stats for all bond interfaces ## Setting interfaces will restrict the stats to the specified ## bond interfaces. # bond_interfaces = ["bond0"]
在此之后,获取您最关心的指标描述非常简单。以下是一些您将使用的常见命令及其返回的信息描述。
active_slave
。这将显示当前活动的从接口,这在使用主动备份模式时很重要。status
。这将显示聚合接口的状态或聚合的从接口状态。值为0表示接口已关闭,而值为1表示已打开。failures
。这将显示聚合从接口的故障总数。
用于监控的关键聚合指标
您应积极监控的一些重要聚合指标包括
- 活动从接口
- 状态(打开或关闭)
- 故障