Ceph 和 Datadog 集成

强大的性能和简易的集成,由 Telegraf 提供支持,Telegraf 是由 InfluxData 构建的开源数据连接器。

info

对于大规模实时查询,这不是推荐的配置。 为了进行查询和压缩优化、高速摄取和高可用性,您可能需要考虑 Ceph 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时序数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它都更有价值。 借助 InfluxDB,这是 #1 的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

输入和输出集成概述

Telegraf 的 Ceph 插件有助于从 Ceph 存储集群中的 MON 和 OSD 节点收集性能指标,以实现有效的监控和管理。

Datadog Telegraf 插件支持向 Datadog Metrics API 提交指标,通过可靠的指标摄取流程,促进高效的监控和数据分析。

集成详情

Ceph

Ceph Storage Telegraf 插件旨在从 Ceph 存储集群内的 Monitor (MON) 和 Object Storage Daemon (OSD) 节点收集性能指标。 Ceph 是一种高度可扩展的存储系统,通过此插件集成其指标收集,从而方便地监控其组件。 随着 13.x Mimic 版本中引入此插件,用户可以有效地收集有关其 Ceph 基础设施性能和运行状况的详细见解。 它的工作原理是扫描配置的套接字目录以查找特定的 Ceph 服务套接字文件,通过 Ceph 管理界面执行命令,并解析返回的 JSON 数据以获取指标。 这些指标基于顶级键进行组织,从而可以有效地监控和分析集群性能。 通过允许管理员了解系统行为并主动识别潜在问题,此插件为管理和维护 Ceph 集群的性能提供了宝贵的功能。

Datadog

此插件写入 Datadog Metrics API,使用户能够发送指标以进行监控和性能分析。 通过使用 Datadog API 密钥,用户可以配置插件以建立与 Datadog v1 API 的连接。 该插件支持各种配置选项,包括连接超时、HTTP 代理设置和数据压缩方法,确保适应不同的部署环境。 将计数指标转换为速率的能力增强了 Telegraf 与 Datadog 代理的集成,这对于依赖实时性能指标的应用程序尤其有利。

配置

Ceph

[[inputs.ceph]]
  ## This is the recommended interval to poll. Too frequent and you
  ## will lose data points due to timeouts during rebalancing and recovery
  interval = '1m'

  ## All configuration values are optional, defaults are shown below

  ## location of ceph binary
  ceph_binary = "/usr/bin/ceph"

  ## directory in which to look for socket files
  socket_dir = "/var/run/ceph"

  ## prefix of MON and OSD socket files, used to determine socket type
  mon_prefix = "ceph-mon"
  osd_prefix = "ceph-osd"
  mds_prefix = "ceph-mds"
  rgw_prefix = "ceph-client"

  ## suffix used to identify socket files
  socket_suffix = "asok"

  ## Ceph user to authenticate as, ceph will search for the corresponding
  ## keyring e.g. client.admin.keyring in /etc/ceph, or the explicit path
  ## defined in the client section of ceph.conf for example:
  ##
  ##     [client.telegraf]
  ##         keyring = /etc/ceph/client.telegraf.keyring
  ##
  ## Consult the ceph documentation for more detail on keyring generation.
  ceph_user = "client.admin"

  ## Ceph configuration to use to locate the cluster
  ceph_config = "/etc/ceph/ceph.conf"

  ## Whether to gather statistics via the admin socket
  gather_admin_socket_stats = true

  ## Whether to gather statistics via ceph commands, requires ceph_user
  ## and ceph_config to be specified
  gather_cluster_stats = false

Datadog

[[outputs.datadog]]
  ## Datadog API key
  apikey = "my-secret-key"

  ## Connection timeout.
  # timeout = "5s"

  ## Write URL override; useful for debugging.
  ## This plugin only supports the v1 API currently due to the authentication
  ## method used.
  # url = "https://app.datadoghq.com/api/v1/series"

  ## Set http_proxy
  # use_system_proxy = false
  # http_proxy_url = "http://localhost:8888"

  ## Override the default (none) compression used to send data.
  ## Supports: "zlib", "none"
  # compression = "none"

  ## When non-zero, converts count metrics submitted by inputs.statsd
  ## into rate, while dividing the metric value by this number.
  ## Note that in order for metrics to be submitted simultaenously alongside
  ## a Datadog agent, rate_interval has to match the interval used by the
  ## agent - which defaults to 10s
  # rate_interval = 0s

输入和输出集成示例

Ceph

  1. 动态监控仪表板:利用 Ceph 插件创建一个实时监控仪表板,以可视化表示 Ceph 集群的性能指标。 通过将这些指标集成到集中式仪表板中,系统管理员可以立即深入了解存储基础设施的运行状况,这有助于在潜在问题升级之前快速识别和解决这些问题。

  2. 自动化警报系统:结合警报解决方案实施 Ceph 插件,以自动通知管理员 Ceph 集群内的性能下降或操作问题。 通过定义关键指标的阈值,组织可以确保及时的响应措施,从而提高整体系统可靠性和性能。

  3. 性能基准测试:使用此插件收集的指标,在 Ceph 存储集群的不同配置或硬件设置中进行性能基准测试。 此过程可以帮助组织识别优化性能和资源利用率的最佳配置,从而促进更高效的存储环境。

  4. 容量规划和预测:将从 Ceph 存储插件收集的指标集成到更广泛的数据分析和报告工具中,以方便容量规划。 通过分析历史指标,组织可以预测未来的利用率趋势,从而为有效扩展存储资源做出明智的决策。

Datadog

  1. 实时基础设施监控:使用 Datadog 插件实时监控服务器指标,方法是将 CPU 使用率和内存统计信息直接发送到 Datadog。 这种集成允许 IT 团队在集中式仪表板中可视化和分析系统性能指标,从而能够主动响应任何新出现的问题,例如资源瓶颈或服务器过载。

  2. 应用程序性能跟踪:利用此插件提交特定于应用程序的指标,例如请求计数和错误率,到 Datadog。 通过与应用程序监控工具集成,团队可以将基础设施指标与应用程序性能相关联,从而提供洞察力,使他们能够优化代码性能并改善用户体验。

  3. 指标异常检测:配置 Datadog 插件以发送指标,这些指标可以根据 Datadog 机器学习功能检测到的异常模式触发警报和通知。 这种主动监控有助于团队在客户受到影响之前迅速对潜在的中断或性能下降做出反应。

  4. 与云服务集成:通过利用 Datadog 插件从云资源发送指标,IT 团队可以了解云应用程序的性能。 监控延迟和错误率等指标有助于确保满足服务级别协议 (SLA),并有助于优化跨云环境的资源分配。

反馈

感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时序数据时,它都更有价值。 借助 InfluxDB,这是 #1 的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。 它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许根据这些消息创建指标。 它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流读取指标。 它支持多种输入数据格式,并提供使用 DynamoDB 进行检查点操作的功能,以实现可靠的消息处理。

查看集成