新 InfluxDB Cloud 的 5Ws(和 1H)

导航到

有些事情是不可避免的,比如 Thanos、纳税和变革。虽然我们希望简单地拍拍手就能推出新产品,但在现实世界中事情并不这么简单。自 2016 年 1 月以来,InfluxDB 一直是最领先的时间序列数据库。但我们并不满足于现状。改进 InfluxDB 的追求是持续不断的。从今天起,我们将开始推出全新的改进型 InfluxDB Cloud,该产品由 IOx 驱动。

谁:任何与时间序列数据工作的人都将从我们对 InfluxDB Cloud 所做的改进中受益。如果您处理的是高 基数 时间序列数据,如追踪数据,那么 InfluxDB Cloud 将更具吸引力,因为新引擎使无限基数用例成为可能。

什么:除了对无限基数的支持外,InfluxDB Cloud 还有什么新功能?好吧,我们从头开始重建了数据库的存储引擎。InfluxDB 一直擅长处理度量数据,但现在它对事件数据有了更好的支持。在以前的存储引擎中,追踪数据可能会导致性能问题,但新引擎可以轻松处理追踪数据的规模。

我们重新设计和优化了新引擎以支持低延迟查询。我们构建一切的方式支持实时分析,因为传入的数据可以在“热”内存缓存中可用。

我们还更改了存储数据的持久化格式。您可能最初不会认为这是一个优点,但通过使用Parquet格式,我们大大提高了数据压缩率。这可以节省成本,因为您可以在低成本的对象存储(如S3)中保存更多数据并使用更少的内存。Parquet格式还允许与大量数据生态系统进行互操作性,扩展了您时序数据的影响力和价值。

回到查询的主题,最大的更新之一是InfluxDB Cloud现在支持原生的SQL查询。是的,您仍然可以使用InfluxQLFlux来查询您已经编写的查询,但SQL提供了一种熟悉的查询语言,使您在InfluxDB和时序数据方面更快、更容易地入门。

何时和何地:新存储引擎的第一阶段发布今天开始。新的InfluxDB Cloud引擎现在可在两个AWS区域使用——北美一个,欧洲一个。这些区域的所有新账户将自动具备新的存储引擎。在未来几个月内,我们将继续在其他我们目前支持的AWS区域以及其他云提供商(Azure和GCP)提供新的存储引擎。请继续关注更多细节。

为什么:我们的目标非常明确。我们希望为用户提供在处理时序数据时最佳的工具、性能和体验。我们有使用尖端技术使InfluxDB更好的机会,这正是我们做的事情。

如何:要了解我们如何实现所有这些更新和改进,我们需要查看InfluxDB的内部结构。新的存储引擎以Rust语言为基础,我们的开发者用它来编写。我们的团队还广泛使用了Apache Arrow项目,这是一个用于开发处理列式数据的数据分析应用的通用软件框架。在Arrow生态系统内还有其他一些项目进一步推动了这个项目的发展。我们已提到Apache Parquet,用作数据持久化格式。另一个主要组件是Apache DataFusion,它为InfluxDB Cloud提供原生SQL支持,而Apache Flight SQL提供了与其他工具和系统的互操作性。

InfluxDB的未来充满希望,还有更大的事情即将到来。但现在,试试新的InfluxDB Cloud,看看它如何提高您从普通到卓越的时间。