InfluxDB Clustered 发布:面向自管理环境的 InfluxDB 3.0
作者:Rick Spencer / 产品
2023 年 9 月 6 日
导航至
今天,我们很高兴宣布 InfluxDB Clustered,这是我们基于 InfluxDB 3.0 产品套件开发的最新产品。InfluxDB Clustered 是 InfluxDB Enterprise 的演进,InfluxDB Enterprise 是我们广受欢迎的自管理产品,适用于大规模时间序列工作负载。对于企业而言,从 InfluxDB Enterprise 到 InfluxDB Clustered 的性能飞跃是数量级的提升,在分析、存储和成本方面都有显著改进。
与 InfluxDB 3.0 产品套件的其余部分一样,InfluxDB Clustered 在数据写入和读取方面提供相同的高吞吐量,支持无限数据基数、实时数据分析以及原生 SQL 支持,适用于大型时间序列工作负载。InfluxDB 3.0 采用 Rust 开发,并构建在 Apache Arrow 生态系统(DataFusion、Parquet、Flight)之上。由于 Apache Arrow 正在形成一套新的大规模分析工具的核心,因此 InfluxDB 3.0 能够从与下一代工具集固有的互操作性中获益匪浅。
自管理,适用于大规模工作负载
InfluxDB Clustered 与今年早些时候发布的 InfluxDB Cloud Serverless 和 InfluxDB Cloud Dedicated 产品不同,它是一款自管理产品。这使您可以完全控制时间序列数据库,使其非常适合满足企业和合规性要求。InfluxDB Clustered 在您需要的地方运行——本地、私有云或自管理的公共云环境中。这种灵活性源于我们将 InfluxDB Clustered 作为基于 Kubernetes 的容器集合交付,这些容器具有解耦的、独立可扩展的摄取和查询层。
这种高可用性和可扩展性使您能够构建和迭代技术基础设施,以满足您的特定需求。Clustered 允许您随意扩大或缩小集群规模。需要将规模扩大几个小时或几天以适应预期的使用高峰?Clustered 也允许您这样做。无论您的安全或数据驻留要求如何,InfluxDB Clustered 都能处理。
高性能,无限扩展
InfluxDB Clustered 基于 Apache Arrow 开发,用于高性能分析查询——与 InfluxDB 3.0 产品套件的其余部分一样——可以实时处理高速、高容量的分析。这包括管理高基数数据,而不会影响性能。
有几个因素促成了这一发展,其中之一是计算和存储的分离。Clustered 的自管理配置意味着您可以作为用户扩展数据库的组件,以最好地满足您的数据的特定需求。如果我们进一步深入研究存储方面,我们还引入了多层存储。
摄取的数据首先进入热存储层,并立即可用于查询。 无需等待前沿数据的批处理或其他处理。这使得查询速度比以前版本的 InfluxDB 快 45 倍。热存储层包含您实际使用的数据。这也可能包括从冷存储中检索的数据(稍后会详细介绍)。将这种热存储方法与 快 45 倍的数据摄取速率以及处理无限基数数据的能力相结合,意味着用户可以实时从大型数据集中获得洞察,而不会降低数据库性能。
Clustered 还改进了处理历史数据的方式。冷存储层由低成本的云对象存储组成。InfluxDB 将历史数据从热层移到冷层以进行长期存储。这些历史数据始终可用,并且从冷存储中检索数据用于当前查询不会产生额外费用。
存储成本降低 90%
对于时间序列数据而言,存储是一个很大的问题。这是因为数据源会产生大量的时间序列数据,尤其是在企业规模下。希望从这些数据中获得最大价值的公司需要实时分析数据,但他们也需要保留数据,以便将其用于历史或预测分析。
借助 InfluxDB Clustered,组织无需在存储数据和价值驱动的数据分析之间做出选择。InfluxDB 3.0 将存储成本降低 90% 或更多,使您能够使用更少的空间存储更多数据,并且成本仅为原来的一小部分。这种降低的一个重要因素是上面提到的低成本云对象存储。
不过,存储/成本等式中还有另一个关键因素,即数据压缩。InfluxDB 3.0 中的数据压缩主要有两个组成部分。首先是转向列式数据库。这允许数据库单独压缩每一列。由于每列中的数据通常相似,因此按列压缩可以显著提高。
与此同时,InfluxDB 使用 Apache Parquet 作为其数据持久化格式。Parquet 是一种旨在与列式数据结构一起使用的文件格式,它使用这些结构来组织同构数据,以获得更好的压缩效果。它可以同时使用字典和游程编码来有效地压缩和存储重复值。
因此,更便宜的对象存储和更高压缩的数据相结合意味着您可以保留更多数据,使用更少的空间,花费更少的钱。
企业级安全性和合规性
与往常一样,InfluxDB 默认加密传输中的数据。用户也可以期待在不久的将来看到增强的安全功能。这些功能包括私有网络选项、单点登录 (SSO)、审计日志记录、高可用性以及基于属性的访问控制 (ABAC) 等。
立即开始
从 InfluxDB Enterprise 过渡到 InfluxDB Clustered 是一次巨大的飞跃。长期以来,用户不得不在数据库的性能、数据保留和成本之间做出艰难的选择。
InfluxDB Clustered(以及 InfluxDB 3.0 系列的其余产品)几乎消除了这些挑战。它在领先(和历史)数据上提供实时性能,同时降低总体拥有成本。这不仅意味着您可以利用数据做更多事情,而且由于您使用 InfluxDB Clustered 管理自己的基础设施,因此您可以做出更具成本效益的决策,从而降低初始启动成本以及长期维护和管理费用需求。
我们非常高兴能够将这些功能交付到用户手中。要开始使用,请请求概念验证,我们的专家团队将与您联系。