网络研讨会回顾:介绍 InfluxDB 集群版

导航到

时序数据几乎在所有应用程序和服务中都是基础。即使时序不是重点,例如在以物联网传感器数据为中心的应用程序中,它也会以指标、日志和跟踪的形式出现在监控数据中。由于时序数据的独特特性,最好在时序数据库中处理。InfluxDB专为处理高容量和高速度的时序数据摄取,并按比例执行实时分析、警报和异常检测而构建。

网络研讨会介绍 InfluxDB 集群版包括 InfluxDB 集群版的深入演示以及 InfluxDB 自托管、自部署实例的技术介绍。产品市场营销副总裁 Balaji Palani 和高级产品经理 Gunnar Aasen 深入探讨了 InfluxDB 3.0 为什么能够轻松处理高性能时序工作负载。

InfluxDB 3.0

InfluxDB 基于 Apache Arrow 内存中的列式格式构建。Arrow 为新鲜或最近查询的数据提供实时查询响应。Arrow 还提供低延迟的分析查询响应。除了内存数据存储之外,InfluxDB 还将数据持久化为 Apache Parquet 文件,存储在云对象存储中,例如 Amazon S3。Parquet 具有高压缩率,允许客户在更小的空间中存储更多的数据。Parquet 的优异压缩可将数据存储量提高10倍以上,降低成本。除了节省成本的好处外,客户还可以拥有更多数据进行历史趋势分析和训练机器学习(ML)模型。

Parquet 是一个开放数据标准,能够与 ML 工具和高级分析工具互操作。如 Grafana 用于可视化、Pandas DataFrame 用于分析等流行工具可以直接与 Parquet 文件工作。Parquet 的零复制数据共享意味着客户可以直接将数据读入 Snowflake、数据湖或 ML 平台,而无需复制任何数据。

InfluxDB 3.0 使用 DataFusion 查询引擎,除了 InfluxQL 之外,还为 InfluxDB 3.0 带来了本机 SQL 支持。DataFusion 查询引擎的好处包括向量化执行、优化的 I/O 推送策略、优化的数据分区和最先进的并行技术。DataFusion 为列式分析进行了性能优化。DataFusion 即使在查询较长时间范围时也能提供快速结果。

InfluxDB 3.0 架构图 InfluxDB 3.0 架构图

InfluxDB 3.0 通过支持无限基数,解锁了存储指标、事件和跟踪等新用例。客户可以在不遇到限制的情况下,使用数十甚至数亿以上的基数操作他们的系统。查询速度提高了100倍,包括高基数数据的查询速度提高了5倍至45倍。请查看我们的基准测试以获取更多详细信息。

InfluxDB 集群

InfluxDB 集群是InfluxDB Enterprise的下一代产品。集群是InfluxDB的自托管、自管理实例,客户可以将其部署在自己的基础设施上。集群是一个基于Kubernetes的解决方案,利用了底层的Kubernetes基本原理。我们为大型企业创建了集群,这些组织通常寻求大规模的性能,需要更好地控制他们的数据和底层基础设施,并需要企业级的安全性。

集群客户可以调整他们的数据库控制,以满足他们特定的性能、法规或业务要求的数据存储和处理。定制还包括环境——集群可以在Kubernetes运行的地方运行。每个工作负载都可以根据其个别标准进行调整,并优化性能、扩展和/或成本。

观看网络研讨会!

介绍 InfluxDB 集群对压缩和查询进行了深入的探讨,包括从28:43开始的集群产品演示,以及从52:13开始的问答。问答包括有关压缩优化的详细问题,考虑无限基数时的模式设计最佳实践,以及边缘数据复制的未来。

如果您有问题或希望与我们的销售团队联系,您可以在此联系。有关InfluxDB的更多信息,请访问我们的博客或注册免费云账户