InfluxDB 3:面向未来的时间序列全面可用

导航至

今天,我们宣布 InfluxDB 3 时间序列数据库产品线最新成员的公开 Alpha 版本:InfluxDB 3 Core,我们最新的开源产品,以及 InfluxDB 3 Enterprise,一个基于 Core 构建的商业版本,为企业级应用提供增强的功能。

自从我们开始重建 InfluxDB 的核心以来,已经过去了四年多。今天,随着开源版本和企业版本的推出,我们很高兴将产品线扩展到更广泛的社区用户和客户群。该产品线代表了我们在解决大规模管理时间序列数据的复杂性方面十年专业知识的体现。InfluxDB 3 交付的产品能够处理从边缘到云的高速、高基数数据,支持可观测性、物联网/工业物联网以及实时监控和控制方面的关键用例。

时间序列:人工智能和智能系统的基础

时间序列数据无处不在,捕捉着我们互联世界的脉搏,并为我们所依赖的数字和物理系统提供动力。每个连接的设备和应用程序都会生成源源不断的时间序列数据,这些数据在收集和分析后,将作为训练人工智能模型的基础,使人工智能模型能够学习、适应和自主运行。

通过时间的视角分析数据可以揭示模式和趋势,从而解锁预测、实现自动化并推动实时决策。高分辨率时间序列数据不仅仅反映发生了什么;它为检测和响应提供关键背景信息,从而驱动系统学习和自主适应。

大规模管理这些数据本身就具有挑战性,但 InfluxDB 3 的设计宗旨就是满足时间序列数据的实时要求。从摄取来自数百万个传感器的数据到执行复杂的高速查询,InfluxDB 3 使系统从被动变为主动,将数据点转化为可操作的实时情报。

今天,我们正在朝着这个愿景迈出又一大胆的一步,公开发布下一代 InfluxDB 3 产品,提供处理最苛刻的时间序列工作负载所需的性能和可扩展性。

Introducing InfluxDB 3 Core & Enterprise

InfluxDB 3 Core 代表了时间序列数据管理的新范例:高性能的近期数据引擎,为实时监控、数据收集和流分析用例提供卓越的性能。InfluxDB 3 Enterprise 在 Core 的基础上构建,增加了历史分析和数据压缩功能,以便在任何时间范围内进行高效查询,并提供企业级功能,例如读取副本、高可用性、可扩展性和增强的安全性。

Core 和 Enterprise 都可以作为易于设置和运行的单节点软件运行,为开发人员提供一个操作简单的数据库来管理高分辨率数据。此公告扩展了 InfluxDB 3 产品线,使其在早期 Alpha 版本中可供开发人员使用,以便为最苛刻的时间序列数据工作负载带来高性能。

InfluxDB 3 之旅

InfluxDB 3 代表了对时间序列平台可以交付的功能的根本性重新构想:将高分辨率数据转化为可操作的情报,从而支撑当今的系统和应用程序。当我们着手构建新一代 InfluxDB 时,我们的目标不仅仅是提高性能;我们还解决了数据收集、转换和操作方式方面发生的巨大转变。

这需要大胆的决定来彻底重新设计 InfluxDB

  • 我们用 Rust(一种用于提高性能的尖端编程语言)重写了核心引擎,并将其重新设计为列式存储,从而在性能和压缩方面实现了数量级的改进。
  • 我们拥抱、贡献并投资于 Apache Arrow、DataFusion 和 Parquet 等开放标准,确保互操作性和灵活性。
  • 我们为未来而设计,构建了一个平台,该平台可以无缝扩展,以满足驱动实时系统、预测分析和现实世界人工智能应用的大量时间序列数据的需求。
  • 我们开发了一款可以在多种环境中部署的产品,真正满足了开发人员希望构建的方式和地点。
  • 我们认识到数据湖仓作为模型构建和分析工作负载的“工作台”的出现,并围绕零 ETL 的共享文件系统架构了一个实时操作数据库。

最终成果是一个由高性能列式数据库引擎驱动的平台,旨在应对这些挑战,并为时间序列管理设定新的基准

  • 高速摄取,用于捕获来自多个来源的高频数据
  • 实时查询,用于每秒分析数百万个数据点
  • 计算和存储分离,即使在数据量扩展的情况下,也能平衡成本和性能
  • 无限基数,用于分析海量高分辨率数据,不受限制
  • 原生 SQL 和更广泛的生态系统兼容性,用于与流行的 BI 工具无缝集成,而无需学习新的语言

InfluxDB 3 产品线

通过 InfluxDB 3,我们正在实现支持各种环境(云、本地部署或边缘)开发人员的愿景。我们的目标是为每种需求和用例提供合适的产品,以便开发人员和企业可以按照自己的条件进行构建和部署

  • 完全托管的 InfluxDB 3:适用于需要大规模高性能的企业。凭借完全托管的运营、无缝扩展和企业级安全性,我们的 按需付费企业级完全托管 产品是云优先型组织的理想选择。
  • 自托管 InfluxDB 3:专为需要完全控制的团队而构建,我们的 自托管产品 为大规模部署提供高性能和灵活性。在本地、私有云或自托管的公共云中运行它,使用基于 Kubernetes 的容器和独立可扩展的摄取和查询层。
  • 简单设置 InfluxDB 3(早期 Alpha 版本):InfluxDB 3 Core 和 Enterprise 将 InfluxDB 3 的功能带给广大开发人员。借助 Core 或 Enterprise 的简单单节点设置,以及 Enterprise 的多节点设置(可以有或没有 Kubernetes 运行),InfluxDB 3 可以在几秒钟内完成部署,并提供毫不妥协的性能。

基于 FDAP 堆栈构建:开源是我们的核心

InfluxDB 3 Core 延续了我们对宽松开源软件的承诺,采用 MIT 或 Apache 2 双重许可。我们相信宽松的开源是构建充满活力的社区的关键——这种社区可以推动真正的创新。这不仅仅是关于许可;它是一个核心原则,塑造了我们构建和发展技术的方式。

InfluxDB 3 构建于 FDAP 堆栈——Apache Arrow Flight、Apache DataFusion、Apache Arrow 和 Apache Parquet——所有这些都是 Apache 软件基金会 (ASF) 下的基础技术。在开发 InfluxDB 3 时,我们的指导原则之一是尽可能拥抱开源,以便我们可以围绕更大的社区进行构建,并通过更多功能加速平台成熟度。

结果不言自明。自从我们大约五年前开始研究 InfluxDB 3 以来,我们在 将 Apache DataFusion 发展成为高性能列式查询引擎方面发挥了关键作用。长期以来,性能一直是 DataFusion 社区关注的中心,而对速度的重视吸引了来自不断壮大且活跃的社区的大量贡献。今天,DataFusion 已成为 ASF 内的顶级项目,这一里程碑的实现部分归功于 InfluxData 的巨大贡献,并且最近获得了 最快引擎 的认可,用于查询 Apache Parquet 文件。

这种对开放标准和性能的关注是整个 InfluxDB 3 产品套件的基础。通过围绕这些技术进行构建,我们将我们的开源工作投入到这些标准中——通常领导这些上游项目——交付一个高性能平台,该平台结合了速度、灵活性和互操作性,使开发人员能够满足现代时间序列工作负载的需求。

展望未来

今天的公告和扩展后的 InfluxDB 3 产品线的推出标志着在简化管理海量时间序列数据卷的复杂性方面迈出了关键一步。随着数据规模、速度和复杂性的增长,平台必须不断发展。InfluxDB 3 的构建就是为了正面迎接这一挑战。

此版本的根本目的是将开发人员放在首位。InfluxDB 3 简化了管理时间序列数据的复杂性,忠实于我们的 Time to Awesome 理念:更少的开销、更少的摩擦以及更多的时间让开发人员专注于最重要的事情——构建驱动影响力的解决方案。

致我们令人难以置信的开发者和客户社区:感谢你们。你们的反馈和创新推动着我们所做的一切。如果您是 InfluxDB 的新手,那么现在是开始使用的最佳时机。时间序列数据无处不在,支撑着我们世界的系统。InfluxDB 3 将这些数据转化为实时情报,为开发人员提供工具,以有效应对当今的挑战并构建明天的创新。

我们已为未来的旅程做好准备,并期待成为您旅程的一部分。