InfluxDB / 功能 / 湖仓 / 开放数据访问

湖仓 / 开放数据访问

使用InfluxDB和Apache Iceberg将实时分析与现有的数据湖仓集成。

为数据团队打造


什么是开放数据访问以及它是如何工作的?

将专业的时间序列数据处理和实时分析引入您的运营数据,实现零拷贝、无ETL的数据共享,并与您现有的数据湖和数据仓库实现互操作性。通过Apache Iceberg虚拟化数据访问InfluxDB,弥合实时运营与分析数据工具(包括数据湖)之间的差距。

InfluxDB提供高性能的数据摄入、实时查询以及内置的时间序列分析功能。它将数据持久化存储在开源文件格式Apache Parquet的通用存储中,并通过抽象目录以开放表格格式(如Apache Iceberg、Delta-sharing等)实现数据访问虚拟化。

lakehouse-flat
DataLake-Warehouse

实时运营分析

InfluxDB的列式、内存级存储层可以提供亚秒级的查询响应,使您能够支持实时用例,如运营事件分析、威胁监控、游戏分析等。

混合数据持久化

大规模的时间序列数据可以迅速积累,导致数据集庞大且存在基数问题。InfluxDB针对任何规模和基数的时序数据进行优化,以处理高效的存储和分区策略。在现有数据湖中利用InfluxDB进行时序操作工作负载的同时,通过数据访问虚拟化来训练AI/ML模型和执行高级分析。

降低总拥有成本

数据访问虚拟化允许直接访问Parquet文件,无需任何数据移动或需要保留多个数据副本,这有助于通过减少复制、传输和存储成本来降低成本。无需任何ETL可以增加操作效率,因此您可以使用更少的资源做更多的事情。

DataLake-Warehouse-1800px
DataLake-Warehouse-Mobile-760px

客户


初创公司和财富500强企业都在使用InfluxDB构建应用程序。

在Factry之前,VEEMO不得不登录到每个风场的单个SCADA系统,才能查看涡轮机的工作情况。InfluxDB的设置非常简单,无需外部依赖,具有类似SQL的查询语法,且完全开源。

弗雷德里克·范·利克维克,Factry.io商务发展和市场营销经理
BENCHMARKS

寻找开始使用InfluxDB最有效的方法?

无论您是寻找成本节约、降低管理开销同时保持高可用性,还是优化效率,InfluxDB都可以帮助您。 找到最佳启动方式

BLOG

时间序列数据库和数据湖是如何协同工作的

想象一下,您正在处理需要快速分析和长期洞察的流数据。这就是时间序列数据库(TSDB)和数据湖这一强大组合可以提供帮助的地方。 探索文章

技术论文

为什么选择专为时序数据库定制的产品?

详细介绍InfluxDB与其他定制解决方案的不同之处,以及使用时序数据构建的水平用例。 下载论文

技术论文

时序数据分析

准备好优化您的时间序列工作负载了吗?首先确保您掌握了基础知识。 下载论文

BLOG

数据湖解析

阅读全面指南,了解数据湖屋,这是一种结合了数据湖和数据仓库概念的新数据管理架构。 查看文章

集成

使用Telegraf轻松收集数据

Telegraf是一个用Go编写的插件驱动服务器代理,用于收集系统上的指标和数据。免费下载最新的Telegraf! 了解更多

开始使用

实时分析

专为在收集和查询时间序列数据时提供纳秒级精度而设计。 了解更多

与专家交谈