使用 InfluxDB 解锁实时分析的力量
作者:Jason Myers / 开发者
2023 年 12 月 22 日
导航至
关于会议
在 Tech Crunch 主办的本次网络研讨会中,InfluxData 创始人兼首席技术官 Paul Dix、InfluxData 资深工程师 Andrew Lamb 和 InfluxData 开发者倡导者 Jay Clifford 讨论了如何使用 InfluxDB 解锁时间序列数据以进行实时分析。本次会议的重点是新的 InfluxDB 3.0,主持人讨论了使用传统数据库处理时间序列数据的挑战、InfluxDB 的发展以及开源项目在其开发中的应用。
节目流程
- 理解时间序列数据及其用例
- 使用传统数据库处理时间序列数据的挑战
- InfluxDB 的发展和 InfluxDB 3.0 的开发
- 开源项目(Apache Flight、DataFusion、Apache Arrow、Parquet,又名 FDAP 堆栈)在 InfluxDB 3.0 中的应用
- 边缘到云解决方案以及 InfluxDB 对此类场景的支持讨论
- InfluxDB 3.0 的开源版本
- InfluxDB 3.0 与其他时间序列数据库的比较
主要要点
要点 #1: InfluxDB 3.0 在时间序列和观测数据管理方面提供高性能和高级功能。
InfluxDB 3.0 的设计与以前的版本截然不同,它提供高效的数据摄取和高级功能,用于处理各种观测数据。该系统优化了查询性能,并且使用更少的内存和 CPU 核心来摄取比以前版本更多的数据。
提高性能的一个因素是 v3.0 没有进行大量的索引。相反,它将数据组织成 Parquet 文件。“大多数时间序列数据库……实际上是围绕指标用例设计的。它们基于这样的想法:您有一个度量名称,并且您有描述数据的标签或标记……然后您知道一个值,”Dix 解释道。InfluxDB 3.0 不仅处理指标数据;它还处理各种观测数据,包括结构化和半结构化数据。
要点 #2:FDAP 堆栈为数据管理、存储和处理提供了一个强大的系统。
小组成员还讨论了 FDAP 堆栈,这是一个包含 Flight、DataFusion、Arrow 和 Parquet 的系统。FDAP 堆栈代表一个更专业的系统,可以为特定工作负载(包括时间序列数据)提供更好的性能。
“FDAP 堆栈就像 LAMP 堆栈。FDAP 代表 Flight、DataFusion、Arrow 和 Parquet。这个想法是,您将用来构建下一代数据应用程序的底层技术类似于用于构建早期 Web 应用程序的技术。[LAMP 堆栈] 基本上开创了一个构建应用程序的全新世界,因为它非常便宜且坚如磐石……您不必重新发明整个东西,”Lamb 指出。
要点 #3:InfluxDB 3.0 使用户能够实时利用数据。
InfluxDB 3.0 可以实时处理数据。它使用户能够快速摄取数据,使其几乎可以立即用于查询。这种能力对于构建实时监控和警报系统的用户,以及需要不断更新观测仪表板的用户尤其有利。
“在我们的案例中,当我们说时间序列时,我们正在为实时系统进行优化,在这些系统中,人们正在构建始终更新的观测仪表板,并且他们正在构建监控和警报系统,这些系统基本上期望立即查询数据并在数百毫秒内返回结果,亚秒级查询延迟,并且规模非常庞大……”Dix 解释道。
洞察
- 时间序列数据是任何带有时间戳的数据。它跟踪服务器、应用程序、网络、传感器数据等,提供对随时间变化的洞察。
- 由于规模、实时查询、数据生命周期管理和处理高基数数据等方面的问题,传统数据库在处理时间序列数据方面存在困难。
- InfluxDB 旨在解决这些挑战,3.0 版本围绕 Apache Arrow、Apache Arrow、DataFusion 和 Parquet 等开源项目构建。
- InfluxDB 3.0 旨在处理各种观测数据,而不仅仅是指标数据,并针对实时系统进行了优化。
- 即将推出的 InfluxDB 3.0 开源版本 InfluxDB Edge 将是一个单服务器、单进程系统,它可以作为独立系统运行,也可以无缝连接到集中的集群系统。
观看网络研讨会