目录
Google Cloud 的运维套件(原 Google Stackdriver)是 Google 提供的一种云计算系统管理服务,可为 Google Cloud 和 AWS 云环境提供性能指标。
为什么使用 Google Stackdriver Telegraf 插件?
Google Stackdriver Telegraf 插件允许您使用 Cloud Monitoring API v3 查询来自 Google Cloud 和 Amazon Web Services 的 1500 多个指标、日志和跟踪,以存储在 InfluxDB 中。您还可以添加来自您的基础设施、网络、应用程序等的指标,以便您可以全面了解您的整个堆栈。
请注意,此插件访问 API 可能会给您带来成本。
如何监控 Google Stackdriver Telegraf 插件
安装 InfluxDB 和 Telegraf 后,您可以为以下配置配置 Google Stackdriver Telegraf 插件
- 每秒发出的最大 API 调用数
- 收集延迟
- 指标类型缓存列表的 TTL
您还可以添加过滤器以减少匹配的时序数量。
用于监控的关键 Stackdriver 指标
您应主动监控的一些重要 Stackdriver 指标包括
- Google Cloud 指标,适用于 Google Cloud 服务,例如 Compute Engine 和 BigQuery
- Kubernetes 指标,适用于 Google Kubernetes Engine (GKE)
- Istio 指标,适用于 Google Kubernetes Engine 上的 Istio
- Anthos 指标,适用于 VMware 上的 Anthos 集群
- Cloud Monitoring 和 Cloud Logging 代理、Amazon Web Services、开源和第三方应用程序的指标
- 代理指标,适用于运行 Monitoring 和 Logging 代理的 VM 实例
- AWS 指标,适用于 Amazon Web Services,例如 Amazon Redshift 和 Amazon CloudFront
- Knative 指标,适用于 Knative 组件
- 外部指标,适用于开源和第三方应用程序
有关更多信息,请查看文档。