在构建任何软件应用程序时,选择合适的数据库至关重要。所有数据库在性能方面都有不同的优势和劣势,因此,针对您的特定用例和数据模型,决定哪个数据库的优势最大、劣势最小是一项重要的决策。下面您将找到 InfluxDB 和 OSI PI Data Historian 的关键概念、架构、功能、用例和定价模型的概述,以便您可以快速了解它们之间的对比。
本文的主要目的是比较 InfluxDB 和 OSI PI Data Historian 在涉及时间序列数据的工作负载中的性能,而不是所有可能的用例。时间序列数据通常在数据库性能方面提出了独特的挑战。这是由于大量数据被写入以及访问该数据的查询模式造成的。本文并非旨在说明哪个数据库更好;它只是提供了每个数据库的概述,以便您可以做出明智的决定。
InfluxDB 与 OSI PI Data Historian 分解
![]() |
![]() |
|
数据库模型 | 时间序列数据库/数据 Historian |
|
架构 | 云原生架构,可用作托管云服务或在本地硬件上自托管 |
OSIsoft PI System 是一套软件产品,专为工业环境中时间序列数据的实时数据收集、存储和分析而设计。PI System 围绕 PI Server 构建,PI Server 存储、处理数据并将其提供给客户端,并且可以部署在本地或云端。 |
许可证 | MIT |
闭源 |
用例 | 监控、可观测性、物联网、实时分析 |
工业数据管理、实时监控、资产健康跟踪、预测性维护、能源管理 |
可扩展性 | InfluxDB 3.0 采用水平可扩展的解耦存储和计算,可降低高达 90% 的存储成本(基准测试) |
通过分布式架构、数据复制和数据联合支持水平扩展,适用于大规模部署 |
正在寻找最有效的入门方式?
无论您是在寻求节省成本、降低管理开销还是开源,InfluxDB 都能提供帮助。
InfluxDB 概述
InfluxDB 是一个高性能时间序列数据库,能够存储任何形式的时间序列数据,例如指标、事件、日志和跟踪。InfluxDB 由 InfluxData 开发,于 2013 年首次发布。InfluxDB 是一个用 Go 编写的开源数据库,专注于性能、可扩展性和开发者生产力。该数据库针对大规模处理时间序列数据进行了优化,使其成为监控性能指标、物联网数据和实时分析等用例的热门选择。
InfluxDB 3.0 是 InfluxDB 的最新版本,目前在 InfluxDB Cloud Serverless 和 InfluxDB Cloud Dedicated 中可用。它使用 Rust 构建,Rust 是一种现代编程语言,专为性能、安全性和内存管理而设计。InfluxDB 还具有解耦架构,允许计算和存储独立扩展。InfluxDB 3.0 提供对 SQL 和 InfluxQL(自定义类 SQL 查询语言,增加了对基于时间的函数的支持)的查询支持。
OSI PI Data Historian 概述
OSI PI,也称为 OSIsoft PI System,是一个企业级数据管理和分析平台,专为处理来自工业过程、传感器和其他来源的时间序列数据而设计。PI System 由 OSIsoft 开发(于 2021 年被 AVEVA 收购),自 1980 年代推出以来,已广泛应用于能源、制造、公用事业和制药等各个行业。它能够实时收集、存储、分析和可视化大量时间序列数据,使组织能够获得洞察力、优化流程并改进决策。
InfluxDB 用于时间序列数据
InfluxDB 专为时间序列数据而设计,使其非常适合涉及随时间跟踪和分析数据点的应用程序。在数据以高容量持续写入的情况下,它表现出色,同时用户还需要能够快速查询摄取后的数据以用于监控和实时分析用例。
OSI PI Data Historian 用于时间序列数据
OSI PI 是为存储时间序列数据而创建的,使其成为需要管理大量传感器和过程数据的组织的理想选择。它的架构和组件经过优化,可高效且低延迟地收集、存储和分析时间序列数据。PI System 的可扩展性和性能使其成为处理工业过程、物联网设备或其他来源生成的大量数据的组织的理想解决方案。
InfluxDB 关键概念
- 列式存储:InfluxDB 以面向列的格式存储数据,使用 Parquet 进行持久文件存储,并使用 Apache Arrow 作为数据的内存表示。列式存储可以实现更好的数据压缩和更快的分析工作负载查询。
- 数据模型:对于任何使用过其他数据库系统的人来说,InfluxDB 数据模型都会很熟悉。在最高层是存储桶,它类似于其他系统称为数据库的概念。InfluxDB 测量值与表同义。测量的特定数据点包含标签和值。标签用作查询数据的主键的一部分,应使用标签来标识用于查询期间过滤的信息。InfluxDB 是无模式的,因此可以添加新字段,而无需迁移或修改模式。
- 集成:InfluxDB 的构建旨在灵活并适应您的应用程序架构。其中的一个关键方面是 InfluxDB 使读取和写入数据变得容易的多种方式。首先,所有数据库功能都可以通过 HTTP API 或 InfluxDB CLI 访问。为了写入数据,InfluxDB 创建了 Telegraf,这是一个可以通过插件从数百个不同来源收集数据并将数据写入 InfluxDB 的工具。客户端库也可用于最流行的编程语言,以允许写入和查询数据。
- 解耦架构:InfluxDB 3.0 具有解耦架构,允许查询计算、数据摄取和存储独立扩展。这允许根据您的用例微调 InfluxDB,并显著节省成本。
- 查询语言:可以使用标准 SQL 或 InfluxQL(一种 SQL 方言,具有许多对处理时间序列数据有用的专用函数)查询 InfluxDB。
- 保留策略:InfluxDB 允许您定义保留策略,这些策略确定数据在被自动删除之前存储多长时间。这对于管理大容量时间序列数据的存储非常有用。
OSI PI Data Historian 关键概念
- PI Server:PI System 的核心组件,负责数据收集、存储和管理。
- PI 接口和 PI 连接器:软件组件,用于从各种来源收集数据并将其发送到 PI Server。
- PI Asset Framework:建模框架,允许用户创建资产及其关联元数据的分层结构,从而更轻松地理解和分析数据。
- PI DataLink:Microsoft Excel 的加载项,使用户可以直接从 Excel 访问和分析 PI System 数据。
- PI ProcessBook:可视化工具,用于创建 PI System 数据的交互式图形显示。
InfluxDB 架构
在高层次上,InfluxDB 的架构旨在优化时间序列数据的存储和查询性能。InfluxDB 的确切架构会因版本和部署 InfluxDB 的方式而略有不同。
InfluxDB 3.0 的架构可以分解为四个关键组件,这些组件几乎彼此独立运行,从而使 InfluxDB 在配置方面非常灵活。这些组件是数据摄取、数据查询、数据压缩和垃圾回收。数据通过摄取器写入,延迟为毫秒级。数据查询器几乎可以立即查询这些数据,同时压缩器在后台获取新写入的数据文件,并将它们合并为更大的文件,这些文件将发送到对象存储。垃圾回收器负责数据保留和空间回收,通过安排数据的软删除和硬删除。
InfluxDB 架构的关键部分是摄取和查询组件的分离,这允许每个组件根据当前的写入和查询工作负载独立扩展。查询器能够无缝地从摄取器以及对象存储中提取最近写入的数据,这使得数据可以廉价地存储,而不会增加查询延迟。
OSI PI Data Historian 架构
OSI PI 是一个围绕 PI Server 构建的数据管理平台,PI Server 负责数据收集、存储和管理。PI System 使用高效的专有时间序列数据库来存储数据。PI 接口和 PI 连接器从各种来源收集数据并将其发送到 PI Server。PI Asset Framework (AF) 允许用户以分层结构对其资产及其关联数据进行建模,从而更轻松地理解和分析数据。各种客户端工具,例如 PI DataLink 和 PI ProcessBook,使用户能够访问和可视化存储在 PI System 中的数据。
免费时间序列数据库指南
获取对备选方案和选择数据库的关键要求的全面回顾。
InfluxDB 功能
高性能存储和查询
InfluxDB 针对时间序列数据进行了优化,提供高性能的存储和查询功能。在存储方面,InfluxDB 能够借助其解耦架构轻松扩展。对象存储用于持久化数据,查询节点可以独立扩展以提高查询性能和容量。
与以前版本的 InfluxDB 相比,新发布的 InfluxDB 3.0 的数据压缩效率提高了 4.5 倍,查询速度提高了 2.5-45 倍,具体取决于查询类型。
保留策略
InfluxDB 允许用户定义保留策略,这些策略会在指定持续时间后自动删除数据点。此功能有助于管理数据存储成本,并确保仅保留相关数据。
数据压缩
InfluxDB 的存储引擎会自动压缩磁盘上的数据,从而减少存储需求并提高查询性能。借助 InfluxDB 3.0,数据使用 Parquet 文件格式存储,以获得更高的时间序列数据压缩率。
水平扩展和集群
InfluxDB 支持水平扩展和集群,允许用户将数据分布在多个节点上,以提高性能和容错能力。
数据分层
InfluxDB 3.0 能够无缝地将数据从廉价的对象存储移动到更快的存储中,以实现低延迟查询,而无需昂贵的 SSD 或大量 RAM 利用率。这允许用户以更高的频率存储数据更长时间,同时仍然节省存储成本。
OSI PI Data Historian 功能
数据收集和存储
OSI PI 的 PI 接口和 PI 连接器可以从各种来源无缝收集数据,而 PI Server 可以高效地存储和管理数据。
可扩展性
PI System 具有高度可扩展性,允许组织处理大量数据和不断增长的数据源,而不会影响性能。
资产建模
PI Asset Framework (AF) 提供了一种强大的方式来建模资产及其关联数据,从而更轻松地理解和分析复杂的工业流程。
数据可视化
PI DataLink 和 PI ProcessBook 等工具使用户能够分析和可视化存储在 PI System 中的数据,从而促进更好的决策和流程优化。
InfluxDB 用例
监控和告警
InfluxDB 广泛用于监控和告警目的,因为它可以高效地存储和处理各种系统、应用程序和设备生成的时间序列数据。凭借其高性能查询引擎以及与 Grafana 等可视化工具的集成,用户可以创建实时仪表板并根据特定条件或阈值设置告警。
物联网数据存储和分析
由于其高写入和查询性能,InfluxDB 是存储和分析传感器、设备和应用程序生成的物联网数据的理想选择。用户可以利用 InfluxDB 的可扩展性和保留策略来管理大量时间序列数据,并使用其强大的查询语言来深入了解物联网生态系统。
实时分析
InfluxDB 的性能和灵活性使其适用于实时分析用例,例如跟踪用户行为、监控应用程序性能和分析财务数据。凭借其对 InfluxQL 和 SQL 的支持,用户可以实时执行复杂的数据分析和聚合,从而使他们能够做出数据驱动的决策。
OSI PI Data Historian 用例
流程优化
OSI PI 可以通过提供来自传感器和其他来源的时间序列数据的实时洞察,帮助组织识别低效率、监控性能并优化其工业流程。
预测性维护
通过分析历史数据并检测模式或异常,OSI PI 使组织能够实施预测性维护策略,从而减少设备停机时间和维护成本。
能源管理
OSI PI 可用于跟踪各种资产和流程的能源消耗,从而使组织能够识别需要改进的领域并实施节能措施。
InfluxDB 定价模型
InfluxDB 提供多种定价选项,包括免费开源版本、基于云的产品以及用于本地部署的企业版
- InfluxDB Cloud Serverless:InfluxDB Cloud Serverless 是一种托管的、基于云的产品,采用按需付费的定价模型。它提供额外的功能,例如监控、告警和数据可视化。InfluxDB Cloud 在所有主要云提供商中均可用。
- InfluxDB Cloud Dedicated - 这是一种托管云解决方案,可在专用硬件上提供隔离的 InfluxDB 实例,适用于需要隔离或可以从指定和微调硬件配置中获益的用例。
- InfluxDB Enterprise:本地解决方案,具有企业功能,可实现安全性和对集群以及其他水平扩展选项的支持。
- InfluxDB Open Source:InfluxDB 的开源版本可免费使用,并提供数据库的核心功能。
OSI PI Data Historian 定价模型
OSI PI 的定价通常基于多种因素的组合,例如数据源的数量、用户数量以及所需的支持级别。定价详情不公开提供,因为它们是根据组织的具体需求以报价方式提供的。
免费开始使用 InfluxDB
InfluxDB Cloud 是开始存储和分析时间序列数据的最快方式。