Apache 和 Google BigQuery 集成

通过易于集成的强大性能,由 InfluxData 构建的开源数据连接器 Telegraf 提供支持。

info

这不是大规模实时查询的推荐配置。 为了进行查询和压缩优化、高速摄取和高可用性,您可能需要考虑 Apache 和 InfluxDB

50 亿+

Telegraf 下载量

#1

时间序列数据库
来源:DB Engines

10 亿+

InfluxDB 下载量

2,800+

贡献者

目录

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时间序列数据时,它都更有价值。 借助 InfluxDB,这是专为与 Telegraf 扩展而构建的第一名时间序列平台。

查看入门方法

输入和输出集成概述

此插件与 Apache HTTP 服务器的 mod_status 接口,以收集和报告来自服务器的性能指标。

Google BigQuery 插件允许 Telegraf 将指标写入 Google Cloud BigQuery,从而为遥测数据实现强大的数据分析功能。

集成详情

Apache

Apache 插件使用 Apache HTTP 服务器的 mod_status 模块收集服务器性能信息。 它依赖于 mod_status 功能,该功能必须在 Apache 配置中显式启用才能访问机器可读的状态页面。 此插件允许用户获取与 Apache 运行性能相关的多个指标,包括工作进程状态、连接统计信息和服务器负载,从而有助于实时有效地监控和排除 Web 服务器性能故障。

Google BigQuery

Telegraf 的 Google BigQuery 插件实现了与 Google Cloud 的 BigQuery 服务的无缝集成,BigQuery 服务是一个流行的数据仓库和分析平台。 此插件有助于将 Telegraf 收集的指标传输到 BigQuery 数据集中,从而使用户可以更轻松地从其遥测数据执行分析并生成见解。 它需要通过服务帐户或用户凭据进行身份验证,并且旨在处理各种数据类型,从而确保用户可以在指标存储在 BigQuery 表中时保持其完整性和准确性。 配置选项允许围绕数据集规范和处理指标进行自定义,包括管理指标名称中的连字符,流式插入不支持连字符。 对于利用 BigQuery 的可扩展性和强大的查询功能来分析大量监控数据的组织来说,此插件特别有用。

配置

Apache

[[inputs.apache]]
  ## An array of URLs to gather from, must be directed at the machine
  ## readable version of the mod_status page including the auto query string.
  ## Default is "http://localhost/server-status?auto".
  urls = ["http://localhost/server-status?auto"]

  ## Credentials for basic HTTP authentication.
  # username = "myuser"
  # password = "mypassword"

  ## Maximum time to receive response.
  # response_timeout = "5s"

  ## Optional TLS Config
  # tls_ca = "/etc/telegraf/ca.pem"
  # tls_cert = "/etc/telegraf/cert.pem"
  # tls_key = "/etc/telegraf/key.pem"
  ## Use TLS but skip chain & host verification
  # insecure_skip_verify = false

Google BigQuery

# Configuration for Google Cloud BigQuery to send entries
[[outputs.bigquery]]
  ## Credentials File
  credentials_file = "/path/to/service/account/key.json"

  ## Google Cloud Platform Project
  # project = ""

  ## The namespace for the metric descriptor
  dataset = "telegraf"

  ## Timeout for BigQuery operations.
  # timeout = "5s"

  ## Character to replace hyphens on Metric name
  # replace_hyphen_to = "_"

  ## Write all metrics in a single compact table
  # compact_table = ""
  

输入和输出集成示例

Apache

  1. 实时性能监控:使用 Apache 输入插件设置实时仪表板,显示 Apache 服务器的关键性能指标。 通过可视化 BusyWorkers 和平均负载等指标,您可以快速识别性能瓶颈和服务器运行状况问题,从而有助于主动管理 Web 流量负载。

  2. 服务器问题自动警报:根据此插件收集的指标实施警报,以便在性能下降时通知管理员。 例如,如果 BusyWorkers 指标超过特定阈值,则可以触发自动警报,从而确保及时响应事件,以维护正常运行时间和服务的可靠性。

  3. 历史性能分析:将 Apache 插件收集的数据与长期存储解决方案相结合,以跟踪一段时间内的性能趋势。 这种累积的数据有助于了解使用模式、预测资源需求以及就服务器扩展或优化做出明智的决策。

  4. 跨系统监控:使用 Telegraf 将从 Apache 收集的指标与来自 Web 堆栈其他组件的指标集成,以将数据发送到集中式监控解决方案。 这种整体视图可以简化不同技术之间的故障排除和协调,从而确保整个系统的最佳系统性能。

Google BigQuery

  1. 实时分析仪表板:利用 Google BigQuery 插件将实时指标馈送到 Google Cloud 上托管的自定义分析仪表板。 此设置将允许团队实时可视化性能数据,从而提供对系统运行状况和使用模式的见解。 通过使用 BigQuery 的查询功能,用户可以轻松创建量身定制的报告和仪表板来满足其特定需求,从而增强决策过程。

  2. 成本管理和优化分析:利用该插件自动将来自各种服务的成本相关指标发送到 BigQuery。 分析此数据可以帮助企业识别不必要的费用并优化资源使用。 通过在 BigQuery 中执行聚合和转换查询,组织可以创建准确的预测并有效地管理其云支出。

  3. 监控数据跨团队协作:使组织内不同的团队能够使用 BigQuery 共享其监控数据。 借助此 Telegraf 插件,团队可以将其指标推送到中央 BigQuery 实例,从而促进协作。 这种数据共享方法鼓励最佳实践和跨职能意识,从而共同改进系统性能和可靠性。

  4. 容量规划的历史分析:通过使用 BigQuery 插件,公司可以收集和存储容量规划必不可少的历史指标数据。 分析一段时间内的趋势可以帮助预测系统需求并主动扩展基础设施。 组织可以创建时间序列分析并识别告知其长期战略决策的模式。

反馈

感谢您成为我们社区的一份子! 如果您有任何一般性反馈或在这些页面上发现任何错误,我们欢迎并鼓励您提出意见。 请在 InfluxDB 社区 Slack 中提交您的反馈。

强大的性能,无限的扩展

收集、组织和处理海量高速数据。 当您将任何数据视为时间序列数据时,它都更有价值。 借助 InfluxDB,这是专为与 Telegraf 扩展而构建的第一名时间序列平台。

查看入门方法

相关集成

HTTP 和 InfluxDB 集成

HTTP 插件从一个或多个 HTTP(S) 端点收集指标。 它支持各种身份验证方法和数据格式的配置选项。

查看集成

Kafka 和 InfluxDB 集成

此插件从 Kafka 读取消息,并允许根据这些消息创建指标。 它支持各种配置,包括不同的 Kafka 设置和消息处理选项。

查看集成

Kinesis 和 InfluxDB 集成

Kinesis 插件允许从 AWS Kinesis 流中读取指标。 它支持多种输入数据格式,并为可靠的消息处理提供带有 DynamoDB 的检查点功能。

查看集成