InfluxDB / 功能 / 湖仓 / 开放数据访问
湖仓 / 开放数据访问
使用InfluxDB和Apache Iceberg将实时分析与现有的数据湖仓集成。
为数据团队打造
什么是开放数据访问以及它是如何工作的?
将专业的时间序列数据处理和实时分析引入您的运营数据,实现零拷贝、无ETL的数据共享,并与您现有的数据湖和数据仓库实现互操作性。通过Apache Iceberg虚拟化数据访问InfluxDB,弥合实时运营与分析数据工具(包括数据湖)之间的差距。
InfluxDB提供高性能的数据摄入、实时查询以及内置的时间序列分析功能。它将数据持久化存储在开源文件格式Apache Parquet的通用存储中,并通过抽象目录以开放表格格式(如Apache Iceberg、Delta-sharing等)实现数据访问虚拟化。
实时运营分析
InfluxDB的列式、内存级存储层可以提供亚秒级的查询响应,使您能够支持实时用例,如运营事件分析、威胁监控、游戏分析等。
混合数据持久化
大规模的时间序列数据可以迅速积累,导致数据集庞大且存在基数问题。InfluxDB针对任何规模和基数的时序数据进行优化,以处理高效的存储和分区策略。在现有数据湖中利用InfluxDB进行时序操作工作负载的同时,通过数据访问虚拟化来训练AI/ML模型和执行高级分析。
降低总拥有成本
数据访问虚拟化允许直接访问Parquet文件,无需任何数据移动或需要保留多个数据副本,这有助于通过减少复制、传输和存储成本来降低成本。无需任何ETL可以增加操作效率,因此您可以使用更少的资源做更多的事情。

