Arista Lanz消费者监控
免费使用此InfluxDB集成LANZ的缩写是Arista网络可见性延迟分析器,它是一款设计用于通过实时数据收集和报告来跟踪接口拥塞和排队延迟的工具,从而使开发者能够确保始终为最终用户提供最佳性能。通过LANZ的应用层事件导出,您正在处理的所有应用程序都可以使用历史数据来预测即将发生的拥塞和延迟。
换句话说,这是一种在问题有机会在未来变得更大之前迅速识别小问题的方法。这也使应用层能够在网络层完全可见的情况下做出流量和路由决策,从而在整个系统中实现更智能和更主动的行动。
总的来说,LANZ帮助网络运营团队和管理员几乎实时地了解网络的健康状况和运行状况。这使得能够尽早检测到如微爆等情况。LANZ的显著之处在于,它还将持续监控网络拥塞,允许快速检测此类事件,并自动将应用层消息发送给需要查看它们的员工。
当LANZ处于通知模式时,用户将经历几种不同类型的事件。
- “开始”发生在接口上的任何队列超出初始配置期间设置的阈值时。
- 当拥塞队列保持在阈值以上时,会定期生成“更新”事件。
- 当拥塞队列最终降至下限以下时,无论是由于团队成员的干预还是因为一切恢复正常,都会生成“结束”事件。
还有一个轮询模式,其中LANZ将轮询每个ASIC中最拥塞的队列,并以每800微秒一次的频率继续报告,但这仅在Arad和Jericho交换机上可用。根据您的偏好,LANZ还可以将数据导出到系统日志消息。
为什么使用Arista LANZ Consumer的Telegraf插件?
Arista LANZ Consumer Telegraf插件是Arista Networks的延迟分析器(LANZ)的消费者,用于通过TCP在交换机管理IP的50001端口上流数据到InfluxDB。LANZ通过持续监控每个端口的输出队列长度来提供拥塞数据。当输出队列的长度超过该端口的阈值时,LANZ会生成超阈值事件。将这些指标收集到InfluxDB中,您将能够深入了解您的网络,并使您的应用程序能够对网络条件的变化做出反应。您可以与许多其他Telegraf插件配对,以全面了解您的整个应用程序堆栈。
如何使用Arista LANZ Consumer Telegraf插件监控您的网络
关于所有这些,最重要的是理解LANZ默认是禁用的——这意味着您需要手动启用它才能使其正常工作。启用后,您的交换机将监控所选平台上的所有前面板端口、CPU和织物端口的队列长度。队列长度数据以几种不同的格式提供,您可以根据需要选择,包括作为syslog数据、CLI显示、数据流或CSV格式输出。
- 有关配置LANZ的文档
- 启用流式LANZ数据
在Telegraf配置中,您需要列出要从中收集流式指标的服务器。
一旦启用了流式数据,您可以使用以下命令进一步配置系统上的所有内容。只需将示例中的默认值替换为适合您部署的值即可
[[inputs.lanz]] servers = [ "tcp://switch1.int.example.com:50001", "tcp://switch2.int.example.com:50001",
用于监控的关键Arista LANZ Consumer指标
您可以使用的一些重要的Arista LANZ Consumer指标包括
intf_name
switch_id
port_id
entry_type
traffic_class
fabric_peer_intf_name
source
port
queue_size
(整数)time_of_max_qlen
(整数)tx_latency
(整数)q_drop_count
(整数)