新 InfluxDB Cloud 的 5W1H

导航至

有些事情是不可避免的,比如灭霸、纳税和变化。虽然动动手指就能交付新产品固然很好,但在现实世界中事情并非如此简单。自 2016 年 1 月以来,InfluxDB 一直是领先的时间序列数据库。但我们不满足于已有的成就。改进 InfluxDB 的追求是持续不断的。截至今天,我们开始推出由 IOx 驱动的全新改进的 InfluxDB Cloud。

WHO(谁): 任何处理时间序列数据的人都将受益于我们对 InfluxDB Cloud 所做的改进。如果您处理高基数时间序列数据(如跟踪数据),那么 InfluxDB Cloud 将更受关注,因为新引擎支持无限基数用例。

WHAT(什么): 除了支持无限基数之外,InfluxDB Cloud 的新功能还有什么?我们从头开始重建了数据库的存储引擎。InfluxDB 一直非常擅长处理指标,但现在它对事件数据的支持更好了。以前的存储引擎在处理跟踪数据时可能会出现性能问题,而新引擎可以轻松处理跟踪数据的规模。

我们重新设计并优化了新引擎,以实现低延迟查询。我们构建一切的方式为实时分析提供动力,因为传入的数据在“热”内存缓存中可用。

我们还更改了用于存储数据的持久化格式。您最初可能不认为这是一个好处,但通过使用 Parquet 格式,我们大大提高了数据压缩率。这节省了成本,因为您可以保存更多数据,并在低成本对象存储(如 S3)中使用更少的内存。Parquet 格式还允许与各种数据生态系统互操作,从而扩展时间序列数据的范围和价值。

回到查询主题,最大的更新之一是 InfluxDB Cloud 现在支持原生 SQL 查询。是的,您仍然可以使用 InfluxQLFlux 来查询您已经编写的内容,但 SQL 提供了一种熟悉的查询语言,可以更快更轻松地开始使用 InfluxDB 和时间序列数据。

WHEN 和 WHERE(何时何地): 新存储引擎的第一阶段推出今天开始。新的 InfluxDB Cloud 引擎在两个 AWS 区域可用 - 一个在北美,一个在欧洲。这些区域中的所有新帐户将自动拥有新的存储引擎。在未来几个月内,我们将继续在我们当前支持的其他 AWS 区域以及其他云提供商 - Azure 和 GCP 中提供新的存储引擎。请继续关注更多详细信息。

WHY(为什么): 这里的目标非常明确。我们希望为用户提供最佳的工具、性能和体验,以便处理时间序列数据。我们有机会使用尖端技术来改进 InfluxDB,而我们正是这样做的。

HOW(如何): 为了了解我们如何完成所有这些更新和改进,我们需要了解 InfluxDB 的内部结构。新的存储引擎从 Rust 语言开始,我们的开发人员使用 Rust 语言编写了它。我们的团队还广泛使用了 Apache Arrow 项目,这是一个与语言无关的软件框架,用于开发处理列式数据的数据分析应用程序。Arrow 生态系统中还有一些其他项目进一步推动了这个项目向前发展。我们已经提到了 Apache Parquet,它被用作数据持久化格式。另一个主要组件是 Apache DataFusion,它为 InfluxDB Cloud 提供原生 SQL 支持,Apache Flight SQL 提供与其他工具和系统的互操作性。

InfluxDB 的未来是光明的,未来还会有更大的发展。但现在,试用新的 InfluxDB Cloud,看看它如何提高您的 Awesome 时刻。