Arista Lanz 消费者监控

强大的性能和简易的集成,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

50 亿+

Telegraf 下载量

#1

时间序列数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会变得更有价值。借助 InfluxDB,这个排名第一的时间序列平台旨在与 Telegraf 一起扩展。

查看入门方法

LANZ 是 Arista Network Visibility Latency Analyzer 的缩写,它是一种旨在通过实时数据收集和报告来跟踪接口拥塞和排队延迟的工具 - 从而使开发人员可以随时保证最终用户的最佳性能。借助 LANZ 应用程序层事件导出,您正在使用的所有应用程序都可以使用历史数据来预测即将发生的拥塞和延迟。

换句话说,这是一种在小问题有机会变成未来更大的问题之前快速识别它的方法。这也使应用程序层能够通过完全了解网络层来制定流量和路由决策,从而在整个过程中产生更智能、更积极主动的行动。

总的来说,LANZ 帮助网络运营团队和管理员几乎实时地了解网络的健康状况和运行情况。这使得尽早检测到微突发等情况成为可能。LANZ 的显着之处在于,它还将持续监控网络上的拥塞,从而可以快速检测到所述事件并自动向需要查看它们的员工发送应用层消息。

当 LANZ 处于通知模式时,用户将体验到几种不同类型的事件。

  • 当接口上的任何队列超过初始配置期间设置的上限阈值时,会发生“开始”。
  • 当拥塞队列保持在该阈值之上时,会定期生成“更新”事件。
  • 当拥塞队列最终降至下限阈值以下时,将生成“结束”事件,这可能是由于团队成员的干预,也可能是因为情况已自行恢复正常。

还提供轮询模式,在该模式下,LANZ 将轮询每个 ASIC 中最拥塞的队列,并每 800 微秒继续报告,但这仅在 Arad 和 Jericho 交换机上可用。LANZ 还可以根据您的偏好将数据导出到系统日志消息中。

为什么将 Telegraf 插件用于 Arista LANZ Consumer?

Arista LANZ Consumer Telegraf 插件是一个消费者,用于 Arista Networks 的 Latency Analyzer (LANZ),以通过交换机管理 IP 上的端口 50001 通过 TCP 流式传输数据到 InfluxDB。LANZ 通过持续监控每个端口的输出队列长度来提供拥塞数据。当输出队列的长度超过该端口的上限阈值时,LANZ 会生成超阈值事件。将这些指标收集到 InfluxDB 中将使您能够深入了解您的网络,并使您的应用程序能够对网络条件的任何变化做出反应。您可以将其与许多其他 Telegraf 插件配对,以了解整个应用程序堆栈。

如何使用 Arista LANZ Consumer Telegraf 插件监控您的网络

了解所有这一切最重要的事情之一是,LANZ 默认情况下是禁用的 — 这意味着您需要手动启用它才能使其发挥作用。启用后,您的交换机不仅会监控所有前面板端口上的队列长度,还会监控您选择的平台上的 CPU 和光纤通道端口上的队列长度。队列长度数据有几种不同的格式可供您选择,具体取决于您的需求,包括 syslog 数据、CLI 显示、数据流或 CSV 格式输出。

在 Telegraf 配置中,您需要列出要从中收集流式指标的服务器。

启用流式数据后,您可以使用以下命令进一步配置系统上的所有内容。只需将示例中的默认值替换为最适合您部署的值即可

[[inputs.lanz]]
  servers = [
    "tcp://switch1.int.example.com:50001",
    "tcp://switch2.int.example.com:50001",

用于监控的关键 Arista LANZ Consumer 指标

您可以使用的重要 Arista LANZ Consumer 指标包括

  • intf_name (接口名称)
  • switch_id (交换机 ID)
  • port_id (端口 ID)
  • entry_type (条目类型)
  • traffic_class (流量类别)
  • fabric_peer_intf_name (光纤通道对等接口名称)
  • source (来源)
  • port (端口)
  • queue_size (integer) (队列大小(整数))
  • time_of_max_qlen (integer) (最大队列长度时间(整数))
  • tx_latency (integer) (传输延迟(整数))
  • q_drop_count (integer) (队列丢弃计数(整数))
有关更多信息,请查看文档。

项目 URL   文档

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时间序列数据时,它会变得更有价值。借助 InfluxDB,这个排名第一的时间序列平台旨在与 Telegraf 一起扩展。

查看入门方法

相关集成