VMware vSphere 和 ServiceNow 集成

由 InfluxData 开源数据连接器 Telegraf 提供支持,易于集成,性能强大。

info

对于大规模实时查询,这不是推荐的配置。为了优化查询和压缩、实现高速摄取和高可用性,您可能需要考虑 VMware vSphere 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时序数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

性能强大,无限扩展

采集、组织和处理海量高速数据。当您将任何数据视为时序数据时,它会更有价值。InfluxDB 是排名第一的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

输入和输出集成概述

VMware vSphere Telegraf 插件提供了一种从 VMware vCenter 服务器收集指标的方法,从而可以对 vSphere 环境中的虚拟资源进行全面监控和管理。

此输出插件通过 HTTP 将 Telegraf 的指标直接流式传输到 ServiceNow MID Server,利用 nowmetric 序列化器与 ServiceNow 的 Operational Intelligence 和 Event Management 高效集成。

集成详情

VMware vSphere

此插件连接到 VMware vSphere 服务器以收集来自虚拟环境的各种指标,从而实现对虚拟资源的高效监控和管理。它与 vSphere API 接口,收集关于集群、主机、资源池、虚拟机、数据存储和 vSAN 实体的数据,并以适合分析和可视化的格式呈现。该插件对于管理基于 VMware 的基础设施的管理员尤其有价值,因为它有助于实时跟踪系统性能、资源使用情况和操作问题。通过聚合来自多个来源的数据,该插件使用户能够获得洞察力,从而促进关于资源分配、故障排除和确保最佳系统性能的明智决策。此外,对密钥存储集成的支持允许安全处理敏感凭据,从而促进安全和合规性评估方面的最佳实践。

ServiceNow

Telegraf 可用于将指标数据直接发送到 ServiceNow MID Server REST 端点。指标使用 ServiceNow 的 Operational Intelligence (OI) 格式或 JSONv2 格式进行格式化,从而实现与 ServiceNow 的 Event Management 和 Operational Intelligence 平台的无缝集成。序列化器高效地批量处理指标,通过最小化 HTTP POST 请求的数量来减少网络开销。此集成允许用户快速利用 ServiceNow 中的指标来增强可观察性、主动事件管理和性能监控,并利用 ServiceNow 的 Operational Intelligence 功能。

配置

VMware vSphere

[[inputs.vsphere]]
  vcenters = [ "https://vcenter.local/sdk" ]
  username = "[email protected]"
  password = "secret"

  vm_metric_include = [
    "cpu.demand.average",
    "cpu.idle.summation",
    "cpu.latency.average",
    "cpu.readiness.average",
    "cpu.ready.summation",
    "cpu.run.summation",
    "cpu.usagemhz.average",
    "cpu.used.summation",
    "cpu.wait.summation",
    "mem.active.average",
    "mem.granted.average",
    "mem.latency.average",
    "mem.swapin.average",
    "mem.swapinRate.average",
    "mem.swapout.average",
    "mem.swapoutRate.average",
    "mem.usage.average",
    "mem.vmmemctl.average",
    "net.bytesRx.average",
    "net.bytesTx.average",
    "net.droppedRx.summation",
    "net.droppedTx.summation",
    "net.usage.average",
    "power.power.average",
    "virtualDisk.numberReadAveraged.average",
    "virtualDisk.numberWriteAveraged.average",
    "virtualDisk.read.average",
    "virtualDisk.readOIO.latest",
    "virtualDisk.throughput.usage.average",
    "virtualDisk.totalReadLatency.average",
    "virtualDisk.totalWriteLatency.average",
    "virtualDisk.write.average",
    "virtualDisk.writeOIO.latest",
    "sys.uptime.latest",
  ]

  host_metric_include = [
    "cpu.coreUtilization.average",
    "cpu.costop.summation",
    "cpu.demand.average",
    "cpu.idle.summation",
    "cpu.latency.average",
    "cpu.readiness.average",
    "cpu.ready.summation",
    "cpu.swapwait.summation",
    "cpu.usage.average",
    "cpu.usagemhz.average",
    "cpu.used.summation",
    "cpu.utilization.average",
    "cpu.wait.summation",
    "disk.deviceReadLatency.average",
    "disk.deviceWriteLatency.average",
    "disk.kernelReadLatency.average",
    "disk.kernelWriteLatency.average",
    "disk.numberReadAveraged.average",
    "disk.numberWriteAveraged.average",
    "disk.read.average",
    "disk.totalReadLatency.average",
    "disk.totalWriteLatency.average",
    "disk.write.average",
    "mem.active.average",
    "mem.latency.average",
    "mem.state.latest",
    "mem.swapin.average",
    "mem.swapinRate.average",
    "mem.swapout.average",
    "mem.swapoutRate.average",
    "mem.totalCapacity.average",
    "mem.usage.average",
    "mem.vmmemctl.average",
    "net.bytesRx.average",
    "net.bytesTx.average",
    "net.droppedRx.summation",
    "net.droppedTx.summation",
    "net.errorsRx.summation",
    "net.errorsTx.summation",
    "net.usage.average",
    "power.power.average",
    "storageAdapter.numberReadAveraged.average",
    "storageAdapter.numberWriteAveraged.average",
    "storageAdapter.read.average",
    "storageAdapter.write.average",
    "sys.uptime.latest",
  ]

  datacenter_metric_include = [] ## if omitted or empty, all metrics are collected
  datacenter_metric_exclude = [ "*" ] ## Datacenters are not collected by default.

  vsan_metric_include = [] ## if omitted or empty, all metrics are collected
  vsan_metric_exclude = [ "*" ] ## vSAN are not collected by default.

  separator = "_"
  max_query_objects = 256
  max_query_metrics = 256
  collect_concurrency = 1
  discover_concurrency = 1
  object_discovery_interval = "300s"
  timeout = "60s"
  use_int_samples = true
  custom_attribute_include = []
  custom_attribute_exclude = ["*"]
  metric_lookback = 3
  ssl_ca = "/path/to/cafile"
  ssl_cert = "/path/to/certfile"
  ssl_key = "/path/to/keyfile"
  insecure_skip_verify = false
  historical_interval = "5m"
  disconnected_servers_behavior = "error"
  use_system_proxy = true
  http_proxy_url = ""

ServiceNow

[[outputs.http]]
  ## ServiceNow MID Server metrics endpoint
  url = "http://mid-server.example.com:9082/api/mid/sa/metrics"

  ## HTTP request method
  method = "POST"

  ## Basic Authentication credentials
  username = "evt.integration"
  password = "P@$$w0rd!"

  ## Data serialization format for ServiceNow
  data_format = "nowmetric"

  ## Metric format type: "oi" (default) or "jsonv2"
  nowmetric_format = "oi"

  ## HTTP Headers
  [outputs.http.headers]
    Content-Type = "application/json"
    Accept = "application/json"

  ## Optional timeout
  # timeout = "5s"

  ## TLS configuration options
  # tls_ca = "/etc/telegraf/ca.pem"
  # tls_cert = "/etc/telegraf/cert.pem"
  # tls_key = "/etc/telegraf/key.pem"
  # insecure_skip_verify = false

输入和输出集成示例

VMware vSphere

  1. 动态资源分配:利用此插件监控虚拟机群的资源使用情况,并根据性能指标自动调整资源分配。此场景可能涉及基于从 vSphere API 收集的 CPU 和内存使用率指标实时触发扩展操作,从而确保最佳性能和成本效益。

  2. 容量规划和预测:利用从 vSphere 收集的历史指标进行容量规划。分析 CPU、内存和存储使用率随时间变化的趋势,有助于管理员预测何时需要额外资源,从而避免中断并确保虚拟基础设施能够应对增长。

  3. 自动告警和事件响应:将此插件与告警工具集成,以根据收集的指标设置自动通知。例如,如果主机上的 CPU 使用率超过指定阈值,则可以触发告警并自动启动预定义的补救步骤,例如将虚拟机迁移到利用率较低的主机。

  4. 跨集群性能基准测试:使用收集的指标比较不同 vCenter 中集群的性能。此基准测试提供了关于哪些集群配置产生最佳资源效率的洞察,并可以指导未来的基础设施增强。

ServiceNow

  1. 主动事件管理:利用 Telegraf 和 ServiceNow 集成将基础设施和应用程序指标实时流式传输到 ServiceNow Event Management。基于阈值自动触发事件或补救工作流程,从而显著缩短事件检测和响应时间。

  2. 端到端应用监控:在应用程序堆栈的多个层部署 Telegraf 代理,将性能指标直接发送到 ServiceNow。利用 ServiceNow 的 Operational Intelligence,团队可以关联跨组件的指标,快速识别性能瓶颈。

  3. 动态 CI 性能跟踪:通过使用此插件推送性能数据,将 Telegraf 指标与 ServiceNow 的 CMDB 集成,从而允许基于实时指标自动更新配置项 (CI) 健康状态。这确保了 ServiceNow 中基础设施健康状态的准确和最新。

  4. 云资源优化:使用 Telegraf 从混合云和多云基础设施收集指标,直接流式传输到 ServiceNow。利用这些指标进行实时分析、预测性容量规划和资源优化,从而实现主动管理并降低运营成本。

反馈

感谢您成为我们社区的一份子!如果您有任何一般性反馈或在这些页面上发现了任何错误,我们欢迎并鼓励您提出意见。请在 InfluxDB 社区 Slack 中提交您的反馈。

性能强大,无限扩展

采集、组织和处理海量高速数据。当您将任何数据视为时序数据时,它会更有价值。InfluxDB 是排名第一的时序平台,旨在与 Telegraf 一起扩展。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许基于这些消息创建指标。它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流读取指标。它支持多种输入数据格式,并提供与 DynamoDB 的检查点功能,以实现可靠的消息处理。

查看集成