宣布 InfluxDB Clustered:适用于自管理环境的 InfluxDB 3.0

导航至

今天,我们非常高兴地宣布推出最新产品InfluxDB Clustered,该产品是基于 InfluxDB 3.0 产品套件开发的。InfluxDB Clustered 是我们流行的自管理产品 InfluxDB Enterprise 的进化版,专为大规模时序工作负载而设计。对于企业来说,从 InfluxDB Enterprise 到 InfluxDB Clustered 的性能提升是数量级的,而且在分析、存储和成本方面都有显著改进。

与 InfluxDB 3.0 产品套件的其他产品一样,InfluxDB Clustered 提供相同的高吞吐量数据读写,支持无限数据基数,实时数据分析,以及针对大规模时序工作负载的原生SQL支持。InfluxDB 3.0 使用 Rust 开发,并建立在Apache Arrow生态系统(DataFusionParquetFlight)之上。由于 Apache Arrow 正在成为新一代大规模分析工具的核心,InfluxDB 3.0 能够从与这一下一代工具集的固有互操作性中受益匪浅。

适用于大规模工作负载的自管理

InfluxDB Clustered 与今年早些时候发布的InfluxDB Cloud ServerlessInfluxDB Cloud Dedicated产品不同,它是一个自管理产品。这使您对时序数据库拥有完全的控制权,非常适合满足企业合规性要求。InfluxDB Clustered 可以在任何您需要的地方运行——本地、私有云或自管理的公共云环境中。这种灵活性源于我们以基于 Kubernetes 的容器集合的形式提供 InfluxDB Clustered,具有解耦的、可独立扩展的摄取和查询层。

这种高可用性和可扩展性使您能够构建和迭代技术基础设施以满足您的特定需求。集群化允许您随意扩大或缩小集群规模。需要扩大几小时或几天以应对预期的使用高峰?集群化也能满足这一需求。无论您的安全或数据驻留要求如何,InfluxDB 集群化都能处理。

influxdb-clustered

高性能与无限扩展

基于 Apache Arrow 开发,InfluxDB 集群化(如同 InfluxDB 3.0 产品套件的其他部分)可以处理实时的高速、高量数据分析。这包括在不影响性能的情况下管理高基数数据。

影响这一发展的有几个因素,其中之一是计算和存储的分离。集群化的自管理配置意味着您作为用户可以调整数据库组件,以最佳满足您数据的特定需求。如果我们在存储方面进一步深入,我们还引入了多个存储层。

摄取的数据首先进入热存储层,并立即可用于查询。无需等待批处理或其他对前沿数据的处理。这使得查询速度比 InfluxDB 之前版本快45倍。热存储层包括您实际使用的数据。这也可以包括从冷存储检索的数据(稍后详述)。结合这种热存储方法、45倍更好的数据摄取率和处理无限基数数据的能力,意味着用户可以在实时中对大量数据集进行分析,而不会降低数据库性能。

集群化还改进了处理历史数据的方式。冷存储层由低成本的云对象存储组成。InfluxDB 将历史数据从热层移动到冷层进行长期存储。这些历史数据始终可用,且当前查询从冷存储检索数据不收取额外费用。

存储成本降低90%

在处理时间序列数据时,存储是一个大问题。这是因为源生成了大量时间序列数据,尤其是在企业规模上。希望从这些数据中获得最大价值的公司需要实时分析它们,但也需要保留它们,以便用于历史或预测分析。

使用 InfluxDB 集群化,组织无需在存储数据和价值驱动型数据分析之间做出选择。InfluxDB 3.0 通过使用上述低成本云对象存储,将存储成本降低了90%或更多,让您可以用更少的空间和更小的成本存储更多数据。

然而,在存储/成本等式中还有一个关键因素,那就是数据压缩。InfluxDB 3.0 中数据压缩有两个主要组成部分。首先是将数据库转换为列式数据库。这使得数据库可以针对每个列进行单独压缩。因为每个列中的数据通常相似,所以每列的压缩可以显著更高。

同时,InfluxDB 使用 Apache Parquet 作为其数据持久化格式。Parquet 是一种文件格式,旨在与列式数据结构一起使用,并利用这些结构来组织同质数据以实现更好的压缩。它可以使用字典和运行长度编码来有效地压缩和存储重复值。

因此,更便宜的对象存储和更高压缩率的数据组合意味着您可以以更少的成本保留更多的数据,使用更少的空间。

企业级安全和合规性

与以往一样,InfluxDB 默认情况下会加密传输中的数据。用户可以期待在不久的将来看到增强的安全功能,包括私有网络选项、单点登录(SSO)、审计日志、高可用性和基于属性的访问控制(ABAC)。

今天就开始使用吧

从 InfluxDB 企业版升级到 InfluxDB 集群版是一个巨大的飞跃。长期以来,用户在性能、数据保留和成本之间必须做出艰难的选择。

InfluxDB 集群版(以及 InfluxDB 3.0 的其他产品)几乎消除了这些挑战。它提供了实时性能,在领先(和历史)数据上,同时降低总拥有成本(TCO)。这不仅意味着您可以利用数据做更多事情,而且因为您使用 InfluxDB 集群版自行管理基础设施,您可以做出更具成本效益的决策,从而降低初始启动成本以及长期维护和运营需求。

我们非常激动将这些功能带给我们的用户。要开始使用,请请求概念验证,我们的专家团队将与您联系。