Apache Zookeeper监控

免费使用此InfluxDB集成

Apache ZooKeeper是一个开源项目,它将分布式系统中的配置信息、命名、同步、密码和证书以及组服务集中管理。这使得配置管理更加容易,并且通过改进的、更可靠的变更传播,提高了可靠性。

关于应用开发,Zookeeper被设计为提供跨节点同步的基础设施,这本身是通过在Zookeeper服务器上维护状态类型信息在内存中实现的。在正常工作条件下,Zookeeper服务器将在本地日志文件中保留整个系统状态的副本。较大的Hadoop集群(例如:跨越500个或更多通用服务器的集群)将由多个Zookeeper服务器支持,所有这些服务器都有一个主服务器在顶层服务器上同步一切。

在Zookeeper基础设施内部,一个应用程序可以创建一个称为znode的东西。这是一个文件,它保持在Zookeeper服务器上的内存中,可以由集群中的任何节点更新。任何节点也可以注册在znode发生变化时自动接收通知。换句话说,应用程序现在可以通过在znode内更新其状态来简单地同步它们在分布式集群中的所有任务。这对于组织内大型分布式服务器集的管理和任务序列化至关重要。

为什么使用Apache Zookeeper的Telegraf插件?

因为Apache Zookeeper有助于保持你的面向服务的架构高可用性,因此保持Apache Zookeeper以高效和高效的方式运行是有意义的。您可以使用Apache Zookeeper Telegraf插件来帮助您收集关于实例的关键性能指标,以实现这一点。

如何使用Telegraf插件监控Apache Zookeeper

使用Apache Zookeeper Telegraf插件开始需要您修改一些配置以适应您的环境。只需添加收集指标时要使用的地址(IP或带端口的hostname),设置一些超时,并配置可选的TLS配置。一旦设置完毕,它就会开始将指标推送到您的InfluxDB实例,以便您进行查询、可视化和启动您的Apache Zookeeper实例的运行。

Apache Zookeeper的Telegraf插件主要提供所需的大量上下文。除了了解发生错误时确切发生了什么,您还可以了解问题确切发生的位置以及为什么最初会发生。这是了解问题根本原因的好方法,从而让您可以采取实际行动防止其再次发生。

要使 Apache Zookeeper Telegraf 插件正常运行,只需将以下命令中的默认值替换为您自己的部署中相关的值

# Reads 'mntr' stats from one or many zookeeper servers
[[inputs.zookeeper]]
  ## An array of address to gather stats about. Specify an ip or hostname
  ## with port. ie localhost:2181, 10.0.0.1:2181, etc.

  ## If no servers are specified, then localhost is used as the host.
  ## If no port is specified, 2181 is used
  servers = [":2181"]

  ## Timeout for metric collections from all servers.  Minimum timeout is "1s".
  # timeout = "5s"

  ## Optional TLS Config
  # enable_tls = true
  # tls_ca = "/etc/telegraf/ca.pem"
  # tls_cert = "/etc/telegraf/cert.pem"
  # tls_key = "/etc/telegraf/key.pem"
  ## If false, skip chain & host verification
  # insecure_skip_verify = true

用于监控的关键 Apache Zookeeper 指标

您可以使用 Apache Zookeeper Telegraf 插件主动监控的一些重要 Apache Zookeeper 指标包括

  • approximate_data_size (整数)
  • avg_latency (整数)
  • ephemerals_count (整数)
  • max_file_descriptor_count (整数)
  • max_latency (整数)
  • min_latency (整数)
  • num_alive_connections (整数)
  • open_file_descriptor_count (整数)
  • outstanding_requests (整数)
  • packets_received (整数)
  • packets_sent (整数)
  • version (字符串)
  • watch_count (整数)
  • znode_count (整数)
  • followers (整数,仅领导者)
  • synced_followers (整数,仅领导者)
  • pending_syncs (整数,仅领导者)

请注意,具体字段名称可能因配置、平台以及您当前使用的 Apache Zookeeper 版本而异。

有关更多信息,请参阅文档。

项目 URL   文档

相关资源

InfluxDb-cloud-logo

最强大的时间序列
数据库作为服务

免费开始
Influxdbu

开发者教育

为时间序列应用程序开发者提供的培训。

查看所有教育