多云可观察性之路上的迷雾消散
作者:社区 / 用例,开发者
2022年3月25日
导航至
本文最初发表于 The New Stack。
多云战略对现代企业来说是必要的,正如最近 AWS 停机事件所清楚显示的那样,但管理这种基础设施仍然是一个巨大的挑战。基础设施管理团队长期以来一直在努力协调不同的技术解决方案、政策和服务,以获取对资源的实时视图。结果要么是通过过度配置造成浪费,要么是为繁琐的手动管理和重复性任务付出高昂的代价。
新一代管理应用程序正在填补这一空白,为团队提供一个单一的平台来观察和管理他们在云中的资源。Mist,由时间序列数据库 InfluxDB 驱动,通过提供由灵活的 REST API 启用的统一界面,使 IT 团队能够通过管理其基础设施。
背景
Mist 是一个开源的多云管理平台,它从公共和私有云、虚拟机管理程序、容器和裸机服务器中提取洞察力。在相同的用户界面中,它支持轻松的配置、编排、监控、成本管理和自动化。
该应用程序起源于挫折: Mist 的共同创始人经营着一家 IT 咨询公司 ,他们的客户遍布云服务,这对他们来说是一个管理的噩梦。
共同创始人 Chris Psaltis 表示,他们每天都要回答客户的日常问题,包括他们拥有的资源、它们在哪里、如何控制访问以及如何自动化常见流程。
“我们拥有全球的客户,他们的基础设施遍布各地:AWS、本地、联合定位……为了做出好的决策,你需要数据,这就是为什么在管理基础设施时,监控指标是必不可少的。自从 Mist 早期以来,我们就集成了监控工具,这样我们就可以将那些监控指标汇总到平台中,然后帮助我们的用户做出好的决策,”他说。
上下文数据驱动智能决策
Mist通过本地API连接到基础设施提供商,管理虚拟机并查看其性能,包括CPU使用率和负载平均值。它可以启动、配置、排除故障和销毁单个虚拟机,以及在不同云之间监控和比较性能。它可以显示每个云上有多少虚拟机,它们的成本和性能。用户可以为机器或云设置特定规则,并查看日志。他们可以在机器上执行脚本以安装应用程序和进行备份,或在该云的任何资源上运行应用程序。
Mist允许进行细粒度的资源权限设置,因此管理员可以轻松地根据资源、云级别、全局以及通过标签设置访问权限。例如,他们可以为管理员、开发人员和QA团队设置不同的策略。他们还可以配置Mist,强制团队设置预算并管理资源的销毁,以避免成本超支。如果出现问题,日志可以轻松地在一个Mist仪表板上访问。
虽然Mist最初是基于Collectd和Graphite构思和构建的,但团队很快迁移到了InfluxDB及其收集代理Telegraf,因为它们是为时间序列数据构建的。
基础设施监控数据生命周期
Mist应用程序建立在InfluxDB之上,并使用时间序列数据库作为其核心,用于监控和计量数据。数据由Telegraf代理从目标虚拟机或裸机服务器收集,该代理将监控数据流发送到InfluxDB。计量数据由Gocky聚合,并也输入InfluxDB。计量数据对于用户能够测量其容量很重要,例如,每台机器和每个组织的数据点。从那里,Mist插件Cilia作为规则引擎,根据一组规则评估流数据并触发执行脚本、运行警报或Webhook等操作。
由于以InfluxDB为核心,Mist的开发者可以利用其开源MIT许可证在其之上构建并用于生产。他们不必预先配置度量粒度或预先分配磁盘空间,因为InfluxDB默认提供这些功能。这降低了Mist在扩展其服务时的运营负担,同时也节省了他们在硬件上的开支。
使用Telegraf还意味着他们的用户可以访问其丰富的超过200个插件,以最少的配置从几乎任何数据源收集数据。能够以独立二进制文件的形式部署Telegraf,无需依赖项,也简化了Mist的部署过程。
在Mist中监控虚拟机
用户几乎可以立即开始在Mist中开始,从支持的提供商列表中选择他们的云,并将API令牌粘贴以开始收集数据。使用未经修改的上游版本Telegraf,Mist立即开始记录性能。如果Mist没有对目标机器的SSH访问权限,用户可以手动部署代理。
默认情况下,仪表板为用户提供了一个查看该云所有资源和其成本的观点。从这里,用户可以查看网络信息、文件系统、CPU使用率、进程,并深入到单个虚拟机和日志中。他们还可以编写自定义Python脚本以收集他们需要的特定非默认信息;例如,到IP地址的ping时间。
自动化以实现峰值性能
Cilia插件持续查询InfluxDB中的时序数据和Elasticsearch中的日志数据。Cilia允许用户根据特定的触发器管理警报和其他工作流。例如,如果每分钟有超过一台新机器启动,这可能会表明过度配置,它将向特定团队发送电子邮件。
Mist利用InfluxDB的自定义逻辑来识别动态阈值并自动扩展基础设施。用户可以触发webhooks或自动重启激动的虚拟机。他们可以创建基于虚拟机、云、云组或标签的规则,这些规则将应用于后来添加的新虚拟机,无需进行配置。
利用InfluxDB平台,Mist开发了一个强大的应用程序,它简化并民主化了基础设施管理,为组织节省资金并铺平了更多自动化的道路。
了解更多关于InfluxDB的信息,请访问 www.influxdata.com。
关于作者
Lyndal Cairns(她/她)自从互联网在电话线上发出尖叫声音以来就开始写关于技术的文章。作为一名前记者,她带着好奇心和对理解技术如何帮助我们繁荣的强烈愿望来处理她的工作。