InfluxDB / 功能 / Lakehouse / 数据仓库开放数据访问
Lakehouse / 数据仓库开放数据访问
使用 InfluxDB 解锁实时分析,并使用 Apache Iceberg 接入您现有的数据湖仓。
为数据团队打造
什么是开放数据访问,它是如何工作的?
将专业的时序数据处理和实时分析带到您的运营数据中,并实现零拷贝、无 ETL 的数据共享,以及与您现有数据湖仓和数据仓库的互操作性。通过使用 Apache Iceberg 虚拟化对 InfluxDB 的数据访问,弥合实时运营和分析数据工具(包括湖仓)之间的差距。
InfluxDB 提供高性能数据摄取、实时查询和用于时序分析的内置函数。它以称为 Apache Parquet 的开放文件格式将数据持久化在通用存储上,并对其目录进行抽象,以通过开放表格式(如 Apache Iceberg、Delta-sharing 等)实现数据访问虚拟化。
实时运营分析
InfluxDB 的列式内存层支持亚秒级查询响应,因此您可以为实时用例提供支持,例如运营事件分析、威胁监控、游戏分析等。
混合数据持久化
大规模的时序数据会快速累积,导致具有基数问题的大型数据集。InfluxDB 针对高效的存储和分区策略进行了优化,以处理任何规模和基数的时序数据。利用 InfluxDB 进行时序运营工作负载,同时使用数据访问虚拟化来训练 AI/ML 模型并在您现有的数据湖仓中运行高级分析。
降低总体拥有成本
数据访问虚拟化允许直接数据访问 Parquet 文件,无需任何数据移动或持有数据的多个副本,这通过减少复制、传输和存储成本来帮助降低成本。 缺少任何 ETL 提高了运营效率,因此您可以使用更少的资源做更多的事情。

