在工业物联网中管理时间序列数据
作者:Brian Gilmore / 用例, 开发者
2022 年 4 月 13 日
导航至
本文最初发表于 The New Stack。经许可在此处发布。
工业革命是人类历史上的一个分水岭时期。从零散的家庭手工业到机械化生产的转变,改变了人类的工作方式。自 18 世纪以来,流水线和计算机等一波又一波的创新不断改变着制造业的性质。今天,我们发现自己正处于又一次工业转型之中。通常被称为工业 4.0,这场最新的创新浪潮涉及将数据(无论是原始数据还是训练有素的机器学习模型)馈送到增强制造过程的自主系统。
制造商力求生产出一致且可预测的产出。为了做到这一点,他们采用了物理仪表,即将传感器安装在设备上以测量过程的不同方面。这些传感器是工业物联网 (IIoT) 的基础,并记录有关工业机械如何运行的关键数据。
关键背景:时间
工业运营商需要数据的背景才能开始理解它。无论传感器收集何种类型的读数,它始终包含时间戳。因此,这种时间序列数据为这些读数提供了共享的背景,并成为处理和理解工业 4.0 物联网数据的关键支点。
幸运的是,工业 4.0 的基本原则与时间序列数据的特征相吻合。工业 4.0 力求
- 互联互通 – 设备、传感器和人员相互连接和通信的能力。
- 信息透明 – 互联互通允许从制造过程的所有点收集大量数据。向工业运营商提供这些数据,使他们能够充分了解情况,从而有助于识别创新和改进的领域。
- 技术协助 – 使用集中式仪表板聚合和可视化收集的数据的能力,使工业运营商能够做出明智的决策并当场解决紧急问题。此外,集中式数据视图有助于工业运营商避免执行一系列令人不快或不安全的任务。
- 去中心化决策 – 系统根据收集的数据自主执行其任务的能力。这些系统仅在出现异常时才需要人工输入。
将这些概念和目标与时间序列数据的 IIoT 用例进行比较,您就可以开始了解时间序列数据如何触及工业运营的几乎每个方面,包括物理方面和虚拟方面。
IIoT 用例 | |
指标 | 温度、压力、流量、阀门状态等 |
分辨率 | (亚)秒 |
保留 | 5 到 10 年(或更长),无降采样 |
主要 目标 | 质量保证、整体设备效率 (OEE)、预测性维护 |
纳入时间
工业运营商希望更好地了解其机械和过程,而时间序列数据为此提供了原始数据。将原始数据转化为可操作的见解是工业 4.0 中时间序列数据的关键目标之一。拥有合适的工具来处理、转换和分析数据可以成就或破坏工业 4.0 计划。
这里的挑战在于,许多工厂和制造商使用传统的数据历史库,这是工业 3.0 中常见的时间序列数据库。这些解决方案不适用于工业 4.0 系统有几个原因。
- 成本 – 这些解决方案的设置和维护成本很高,而且还要收取年度许可和支持费。大多数传统数据历史库的安装都需要定制开发工作才能满足特定业务或流程的需求,并且可能需要外部咨询资源。这些系统的专有性质意味着这项工作耗时且成本高昂。
- 供应商锁定 – 这些解决方案通常基于 Windows,并且不提供简单的开放 API 来与其他软件接口。因此,您需要从单个供应商处购买所有集成和组件,从而将您锁定在专有解决方案中。
- 可扩展性 – 可扩展性问题可能源于商业问题和技术问题。在技术方面,这些传统数据历史库的构建考虑了有限的数据集。当引入人工智能或机器学习 (AI/ML) 等高级功能时,就会产生问题。这些功能需要更多数据来训练模型,而传统系统无法处理这些数据。
- 糟糕的开发者体验 – 大多数传统解决方案都采用传统的封闭式设计,API 支持有限。因此,实施或集成这些系统需要花费大量时间和金钱。这些封闭式设计解决方案提供的内置工具很少,没有开发者社区,也不支持模块化开发方法,从而限制了开发者选择最适合其组织需求的工具的能力。
- 数据孤岛 – SCADA 制造商可能会为其设备提供数据历史库,但大多数使用传统制造执行系统 (MES) 的工业组织会将其所有数据整合到单个本地数据历史库中。但是,由于缺乏微服务架构和开放 API,以及广泛使用防火墙和子网,通常会在站点级别隔离数据。
由于无法与现代 IT、云或开源软件 (OSS) 解决方案集成,传统数据历史库无法提供发展工业运营所需的灵活性和连接性。这大大降低了运营技术和 IT 系统及其包含的数据在工业 4.0 环境中的功效,因为数据历史库与其他系统之间缺乏互操作性会阻碍创新并限制可观察性。
替换传统数据历史库
因此,如果传统数据历史库不是答案,那么公司应该改用什么呢?
制造商可能会很想重新使用熟悉的技术(如关系数据库)来替换其传统数据历史库。但是,关系数据库无法针对高容量数据和缺乏固定模式(时间序列数据的特征)进行扩展。
更适合替代传统数据历史库的是开源时间序列平台。例如,InfluxDB 专为处理时间序列数据的容量和速度而构建。它使用 API,因此能够与几乎任何其他连接设备集成。InfluxDB 是一个无模式平台,因此它可以自动调整以适应传入 IIoT 数据形状的变化。
另一个与 InfluxDB 互补的开源工具是 Telegraf,这是一个基于插件的收集代理。Telegraf 使用 Go 编写,编译成单个二进制文件,没有外部依赖项,并且内存占用极小。Telegraf 拥有数百个插件,其中许多插件迎合最流行的 IIoT 技术和协议,例如 OPC-UA、MQTT、Modbus、AMQP 和 Kafka,可以直接连接到或从几乎任何数据库、应用程序、系统或传感器抓取数据。
管理和利用时间序列数据
广泛的连接性还使制造商能够更轻松地监控和管理分布式系统和网络以及现场的远程设备。例如,如果制造商在全国各地有三个不同的工厂,Telegraf 和 InfluxDB 可以让他们收集每个工厂每台机器上每个传感器的数据。
每个工厂生成的数据可以聚合并存储在现场。这些聚合也可以发送到中央存储实例,该实例收集来自所有三个站点的数据,并可以汇总以生成全公司范围的见解。
这些相同的原则适用于边缘上的任何连接设备,无论这包括农村地区的太阳能电池板还是具有 GSM(全球移动通信系统)连接的海洋浮标。无论您的公司如何定义“边缘”,Telegraf 和 InfluxDB 都可以处理来自那里的设备的数据收集。
InfluxDB 拥有成熟的 IIoT 系统生态系统。一些领先的工业系统,包括 PTC Kepware、PTC ThingWorx、Siemens WinCC OA 和 Bosch ctrlX 都使用 InfluxDB 作为其时间序列平台。这些系统已经存在预配置的集成,因此像那些向工业 4.0 过渡的公司可以快速轻松地将其时间序列数据库升级到 InfluxDB。
将数据导入 InfluxDB 是管理和利用时间序列数据的一部分。分析和处理数据是同样重要的部分。Flux 查询语言适用于 InfluxDB 平台的所有组件(即 InfluxDB、Telegraf)。Flux 允许您对时间序列数据进行切片和切块,以生成可操作的见解、设置阈值和警报,并将数据输出到任何所需的端点。通过使用 Flux 和 InfluxDB,您可以为数据创建可视化效果,以帮助识别使用模式和优化领域或预测维护。
底线
最终,将开源时间序列数据库整合到您的工业 4.0 技术堆栈中,有助于弥合运营技术和信息技术之间的差距,为物理工厂和虚拟工厂提供更高的可观察性,并提供有关制造过程各个方面的关键数据。像 InfluxDB 这样的解决方案使工业运营商能够利用数据,为工厂车间的工人提供关键信息,并在整个制造过程中增加可衡量的价值。