使用 InfluxDB 3.0 扩展您的时间序列工作负载:全新工具、改进和产品现已全面上市
作者:David Sprogis / 开发者
2024年9月4日
导航至
自最初发布以来,在过去一年中,InfluxDB 3.0 产品套件 迎来了众多新功能和性能改进。这些改进巩固了 InfluxDB 3.0 作为行业领先的时间序列数据库的地位,它以经济高效的对象存储上的 Parquet 格式提供无与伦比的性能,包括无限基数、高速且独立可扩展的摄取、实时查询和卓越的数据压缩。通过这些更新,InfluxDB 3.0 使开发人员能够更轻松地管理任何规模的时间序列工作负载,无论是在物联网、金融、航空航天还是任何依赖高分辨率数据的环境中。
考虑到这一点,我们很高兴宣布 InfluxDB 3.0 的最新改进和新功能,以及 InfluxDB Clustered(我们用于大规模时间序列工作负载的自托管产品)的全面上市。
InfluxDB 3.0 产品套件的新功能
运维仪表板
InfluxDB Cloud Dedicated 用户现在可以访问 运维仪表板,该仪表板可全面观测其集群的性能。用于监控 InfluxDB Cloud Dedicated 集群的仪表板是由 InfluxData 管理的 Grafana 仪表板。这些仪表板深入了解 InfluxDB 3.0 的每个组件,通过监控数据摄取、查询性能和压缩,来识别潜在的瓶颈和优化机会。
单点登录
InfluxDB Cloud Dedicated 现在支持 单点登录 (SSO),为您的 InfluxDB 集群提供企业级访问控制。通过将您的身份提供商连接到 InfluxData 管理的 Auth0 服务,您可以像管理任何其他系统一样轻松地授予或撤销对 InfluxDB 集群的访问权限。
管理 API
InfluxDB Cloud Dedicated 的 管理 API 简化了数据库、API 令牌和表的可编程管理。借助此 API,用户可以自动化诸如启动新的 InfluxDB 实例、创建具有自定义分区的新数据库以及管理开发人员访问您的 InfluxDB 实例的 API 令牌等操作。
参数化查询
对使用 InfluxQL 和 SQL 的 参数化查询 的支持提高了查询的可重用性,并有助于防止潜在的 SQL 注入攻击。此外,参数化查询可以在应用程序级别用于定义数据操作的权限,并允许更精细的控制。
InfluxDB Clustered 现已全面上市
InfluxDB Clustered 是我们的自托管产品,现已 全面上市,用户可以在私有云或本地环境中利用 InfluxDB 3.0。与 InfluxDB 3.0 产品套件的其余部分一样,InfluxDB Clustered 为大型时间序列工作负载提供相同的高吞吐量数据写入和读取、独立可扩展的写入和读取、对无限数据基数的支持、实时数据分析以及原生 SQL 支持。
InfluxDB Clustered 可以使用 Helm chart 部署到 Kubernetes,并具有完全解耦的摄取、查询和存储层。这种架构允许您根据需要独立扩展 InfluxDB 部署的组件。这种高可用性和可扩展性使您能够定制您的技术基础设施以满足您的特定工作负载和需求。无论您的工作负载是写入密集型、读取密集型还是两者兼而有之,并且如果您有严格的安全性和数据驻留要求,InfluxDB Clustered 都能灵活地处理所有这些。
InfluxDB 3.0 性能改进
InfluxDB 3.0 在多个方面持续取得显著的性能改进。主要增强功能包括对 InfluxDB 3.0 核心的开源 Apache DataFusion 引擎的上游贡献。这些贡献不仅使 InfluxDB 3.0 受益,也使整个 DataFusion 社区受益。其他性能改进来自 InfluxDB 特有的功能,例如自定义分区,它允许用户针对其特定工作负载优化 InfluxDB,从而获得更好的性能。
以下仅列举 InfluxDB 3.0 发布以来所做的一些性能改进
- 自定义分区:InfluxDB Clustered 和 Cloud Dedicated 现在允许开发人员定义其数据在底层 Parquet 文件中的分组方式。默认情况下,数据按天分区,每天的数据存储在同一个 Parquet 文件中。自定义分区使您可以根据您的需求调整此时间范围或按特定标签进行分区。例如,如果您经常按特定标签值进行查询,您可以相应地进行分区,确保其存储在同一文件中,从而通过减少查询期间访问的文件数量来提高性能。也可以使用标签和时间的组合创建分区。阅读文档以了解有关此功能的更多信息。
- 改进的聚合和分组性能:通过增强 DataFusion 中的并行聚合,InfluxDB 3.0 在各种类型的聚合和分组查询中实现了 2-3 倍的性能提升。这是通过重写 DataFusion 的 Group By 实现的某些部分来实现的,以减少分配并更好地利用向量化。
- 更快的字符串密集型查询性能:在 DataFusion 中添加 StringView 支持后,涉及字符串的查询性能提高了 20-200%。此改进是通过改进 UTF-8 验证和编译器优化来实现的。
这些性能增强使 ju:niz Energy 等公司能够将其存储的数据量增加约 100 倍,同时保持查询性能,并由于 InfluxDB 3.0 中低成本对象存储而降低存储成本。另一个很好的例子是 Joby Aviation,该公司使用 InfluxDB Clustered 来快速摄取、高效压缩和保留从其电动垂直起降 (eVTOL) 飞机生成的大量时间序列数据,同时将存储成本控制在可控范围内。
立即开始使用 InfluxDB 3.0
InfluxDB 3.0 不断发展和改进,提供强大的功能套件和性能,以支持任何时间序列数据工作负载。无论您是管理 物联网传感器数据、监控应用程序,还是 将火箭发射到太空,InfluxDB 3.0 都拥有您成功所需的工具、性能和灵活性。
要开始使用 InfluxDB 3.0,请与我们的销售团队联系 或开始 概念验证。