Ceph 和 ServiceNow 集成

强大的性能和简单的集成,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

info

对于大规模实时查询,这不是推荐的配置。 为了进行查询和压缩优化、高速摄取和高可用性,您可能需要考虑Ceph 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时序数据库
来源:DB Engines

10 亿+

InfluxDB 的下载量

2,800+

贡献者

目录

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时序数据时,它都会更有价值。使用 InfluxDB,这是 #1 的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

输入和输出集成概述

Telegraf 的 Ceph 插件有助于收集 Ceph 存储集群中 MON 和 OSD 节点的性能指标,以便进行有效的监控和管理。

此输出插件通过 HTTP 将指标从 Telegraf 直接流式传输到 ServiceNow MID Server,利用 nowmetric 序列化器与 ServiceNow 的 Operational Intelligence 和 Event Management 高效集成。

集成详情

Ceph

Ceph Storage Telegraf 插件旨在收集 Ceph 存储集群中 Monitor (MON) 和 Object Storage Daemon (OSD) 节点的性能指标。 Ceph 是一种高度可扩展的存储系统,通过此插件集成其指标收集,从而 облегчает 轻松监控其组件。 随着 13.x Mimic 版本中引入此插件,用户可以有效地收集有关其 Ceph 基础设施的性能和运行状况的详细见解。 它的工作原理是扫描配置的套接字目录以查找特定的 Ceph 服务套接字文件,通过 Ceph 管理界面执行命令,并解析返回的 JSON 数据以获取指标。 指标基于顶级键进行组织,从而可以有效地监控和分析集群性能。 此插件通过允许管理员了解系统行为并主动识别潜在问题,为管理和维护 Ceph 集群的性能提供了宝贵的功能。

ServiceNow

Telegraf 可用于将指标数据直接发送到 ServiceNow MID Server REST 端点。 指标使用 ServiceNow 的 Operational Intelligence (OI) 格式或 JSONv2 格式进行格式化,从而实现与 ServiceNow 的 Event Management 和 Operational Intelligence 平台的无缝集成。 序列化器有效地批量处理指标,通过最大限度地减少 HTTP POST 请求的数量来降低网络开销。 此集成允许用户在 ServiceNow 中快速利用指标,以增强可观察性、主动事件管理和性能监控,并利用 ServiceNow 的 Operational Intelligence 功能。

配置

Ceph

[[inputs.ceph]]
  ## This is the recommended interval to poll. Too frequent and you
  ## will lose data points due to timeouts during rebalancing and recovery
  interval = '1m'

  ## All configuration values are optional, defaults are shown below

  ## location of ceph binary
  ceph_binary = "/usr/bin/ceph"

  ## directory in which to look for socket files
  socket_dir = "/var/run/ceph"

  ## prefix of MON and OSD socket files, used to determine socket type
  mon_prefix = "ceph-mon"
  osd_prefix = "ceph-osd"
  mds_prefix = "ceph-mds"
  rgw_prefix = "ceph-client"

  ## suffix used to identify socket files
  socket_suffix = "asok"

  ## Ceph user to authenticate as, ceph will search for the corresponding
  ## keyring e.g. client.admin.keyring in /etc/ceph, or the explicit path
  ## defined in the client section of ceph.conf for example:
  ##
  ##     [client.telegraf]
  ##         keyring = /etc/ceph/client.telegraf.keyring
  ##
  ## Consult the ceph documentation for more detail on keyring generation.
  ceph_user = "client.admin"

  ## Ceph configuration to use to locate the cluster
  ceph_config = "/etc/ceph/ceph.conf"

  ## Whether to gather statistics via the admin socket
  gather_admin_socket_stats = true

  ## Whether to gather statistics via ceph commands, requires ceph_user
  ## and ceph_config to be specified
  gather_cluster_stats = false

ServiceNow

[[outputs.http]]
  ## ServiceNow MID Server metrics endpoint
  url = "http://mid-server.example.com:9082/api/mid/sa/metrics"

  ## HTTP request method
  method = "POST"

  ## Basic Authentication credentials
  username = "evt.integration"
  password = "P@$$w0rd!"

  ## Data serialization format for ServiceNow
  data_format = "nowmetric"

  ## Metric format type: "oi" (default) or "jsonv2"
  nowmetric_format = "oi"

  ## HTTP Headers
  [outputs.http.headers]
    Content-Type = "application/json"
    Accept = "application/json"

  ## Optional timeout
  # timeout = "5s"

  ## TLS configuration options
  # tls_ca = "/etc/telegraf/ca.pem"
  # tls_cert = "/etc/telegraf/cert.pem"
  # tls_key = "/etc/telegraf/key.pem"
  # insecure_skip_verify = false

输入和输出集成示例

Ceph

  1. 动态监控仪表板:利用 Ceph 插件创建实时监控仪表板,以可视化方式表示 Ceph 集群的性能指标。 通过将这些指标集成到集中式仪表板中,系统管理员可以立即深入了解存储基础设施的运行状况,这有助于在潜在问题升级之前快速识别和解决这些问题。

  2. 自动化警报系统:结合警报解决方案实施 Ceph 插件,以自动通知管理员 Ceph 集群内的性能下降或操作问题。 通过为关键指标定义阈值,组织可以确保及时的响应操作,从而提高整体系统可靠性和性能。

  3. 性能基准测试:使用此插件收集的指标,对 Ceph 存储集群的不同配置或硬件设置进行性能基准测试。 此过程可以帮助组织识别优化性能和资源利用率的最佳配置,从而促进更高效的存储环境。

  4. 容量规划和预测:将从 Ceph 存储插件收集的指标集成到更广泛的数据分析和报告工具中,以促进容量规划。 通过分析历史指标,组织可以预测未来的利用率趋势,从而就有效扩展存储资源做出明智的决策。

ServiceNow

  1. 主动事件管理:利用 Telegraf 和 ServiceNow 集成将基础设施和应用程序指标实时流式传输到 ServiceNow Event Management。 根据阈值自动触发事件或补救工作流,从而显著缩短事件检测和响应时间。

  2. 端到端应用程序监控:在应用程序堆栈的多个层中部署 Telegraf 代理,将性能指标直接发送到 ServiceNow。 利用 ServiceNow 的 Operational Intelligence,团队可以将跨组件的指标关联起来,快速识别性能瓶颈。

  3. 动态 CI 性能跟踪:通过使用此插件推送性能数据,将 Telegraf 指标与 ServiceNow 的 CMDB 集成,从而允许基于实时指标自动更新配置项 (CI) 运行状况状态。 这确保了 ServiceNow 中基础设施运行状况的准确和当前状态。

  4. 云资源优化:使用 Telegraf 从混合云和多云基础设施收集指标,直接流式传输到 ServiceNow。 利用这些指标进行实时分析、预测性容量规划和资源优化,从而实现主动管理并降低运营成本。

反馈

感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现了任何错误,我们欢迎并鼓励您提出意见。 请在InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展能力

收集、组织和处理海量高速数据。当您将任何数据视为时序数据时,它都会更有价值。使用 InfluxDB,这是 #1 的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。 它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许基于这些消息创建指标。 它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流中读取指标。 它支持多种输入数据格式,并提供使用 DynamoDB 进行检查点操作的功能,以实现可靠的消息处理。

查看集成