工业物联网中的时序数据处理

导航到

本文最初发布在 The New Stack。在此获得许可。

工业革命是人类历史上的一个转折点。从零散的手工业到机械化生产的转变改变了人类的工作方式。自18世纪以来,从流水线到计算机等创新浪潮持续改变和改变制造业的本质。如今,我们正处于另一次工业转型的过程中。通常被称为工业4.0,这一最新一波的创新涉及向自主系统提供数据——无论是原始数据还是训练有素的机器学习模型——以增强制造过程。

制造商寻求产生一致和可预测的输出。为了做到这一点,他们已经采用了物理仪器,这涉及到在设备上安装传感器来测量过程的不同方面。这些传感器是工业物联网(IIoT)的基础,并记录有关工业机械如何运作的关键数据。

关键背景:时间

 工业操作员需要这些数据的背景才能开始理解它们。无论传感器收集到什么类型的读数,它始终包含一个时间戳。因此,这种时序数据为这些读数提供了一个共享的背景,并成为处理和理解工业4.0物联网数据的临界支点。

幸运的是,支撑工业4.0的基本原则与时序数据的特征相吻合。工业4.0追求

  • 互联互通 — 设备、传感器和人员相互连接和通信的能力。
  • 信息透明度 — 互联互通允许从制造过程的各个点收集大量数据。将这些数据提供给工业操作员,为他们提供有见地的理解,有助于识别创新和改进的领域。
  • 技术支持 — 能够使用集中式仪表板聚合和可视化收集到的数据,使工业操作员能够做出明智的决策并即时解决紧急问题。此外,集中式数据视图有助于工业操作员避免执行一系列令人不愉快或不安全的任务。
  • 去中心化决策 — 系统能够根据收集到的数据自主执行其任务的能力。这些系统只需要人类输入来处理异常情况。

将这些概念和目标与一些工业物联网(IIoT)时间序列数据用例进行比较,您就可以开始了解时间序列数据几乎触及工业运营的各个方面,无论是物理的还是虚拟的。

IIoT用例
指标 温度、压力、流量、阀门状态等。
分辨率 (子)秒
保留 5至10年(或更长),无需下采样
主要 目标 质量保证,总体设备效率(OEE),预测性维护

融入时间

工业操作员希望对他们的机械和流程有更高的可观察性,而时间序列数据提供了这些原始数据。将原始数据转化为可操作的见解是工业4.0时代时间序列数据的关键目标之一。拥有合适的工具来处理、转换和分析这些数据,可以使或打破工业4.0的倡议。

这里的挑战在于,许多工厂和制造商使用遗留的数据历史记录器,这是在工业3.0中常见的时序数据库。这些解决方案不适合工业4.0系统的几个原因。

  • 成本 – 这些解决方案的设置和维护成本很高,还需要支付年度许可和支持费用。大多数遗留数据历史记录器的安装需要针对特定业务或流程进行定制开发工作,可能还需要外部咨询资源。这些系统的专有性质意味着这项工作既耗时又昂贵。
  • 供应商锁定 – 这些解决方案通常基于Windows,不提供简单的、开放的API与其他软件接口。因此,您需要从单个供应商那里购买所有集成和组件,将您锁定在专有解决方案中。
  • 可扩展性 – 可扩展性问题可能源于商业和技术问题。在技术方面,这些遗留数据历史记录器是在有限数据集的背景下构建的。当引入人工智能或机器学习(AI/ML)等高级功能时,这会引发问题。这些功能需要更多的数据进行模型训练,而遗留系统无法处理。
  • 开发人员体验差 – 大多数遗留解决方案具有传统的封闭设计,API支持有限。因此,实施或集成这些系统需要大量的时间和金钱。这些封闭设计解决方案提供的内置工具很少,没有开发人员社区,不支持模块化开发方法,从而限制了开发人员选择最适合其组织需求工具的能力。
  • 数据孤岛SCADA制造商可能为其设备提供数据历史记录器,但大多数使用传统制造执行系统(MES)的工业组织将所有数据汇总到单个本地数据历史记录器。然而,由于缺乏微服务架构和开放API,以及广泛使用防火墙和子网,通常在站点级别隔离数据。

由于无法与现代化的IT、云或开源软件(OSS)解决方案集成,遗留数据历史记录器无法提供适应工业运营演变的必要灵活性和连接性。这在工业4.0环境中显著降低了相关操作技术和IT系统及其包含的数据的有效性,因为数据历史记录器与其他系统之间缺乏互操作性,阻碍了创新并限制了可观察性。

取代遗留数据历史记录器

因此,如果遗留数据历史记录器不是解决方案,公司应该使用什么代替呢?

制造商可能会倾向于使用熟悉的技术,例如关系数据库,来替代他们的旧版数据历史记录器。然而,关系数据库无法扩展以处理高容量数据以及时序数据缺乏固定架构的特点。

旧版数据历史记录器的更合适替代品是开源时序平台。例如,InfluxDB就是专为处理时序数据量和高速度而设计的。它使用API,因此能够与几乎任何其他连接设备集成。InfluxDB是一个无模式平台,因此它可以自动调整以适应传入IIoT数据形状的变化。

补充InfluxDB的另一个开源工具是Telegraf,这是一个基于插件的收集代理。Telegraf是用Go编写的,编译成一个没有外部依赖的单个二进制文件,并且占用最小的内存空间。它拥有数百个插件,其中许多针对最流行的IIoT技术和协议,如OPC-UA、MQTT、Modbus、AMQP和Kafka,Telegraf可以直接连接到或从几乎任何数据库、应用程序、系统或传感器中抓取数据。

管理和利用时序数据

这种广泛的连接性也使得制造商更容易地监控和管理分布式系统和网络以及现场远程设备。例如,如果一家制造商在全国有三个不同的设施,Telegraf和InfluxDB允许他们收集每个设施每台机器上每个传感器的数据。

每个设施产生的数据可以汇总并存储在现场。这些汇总也可以发送到中央存储实例,该实例收集来自所有三个站点并汇总以生成公司级的洞察。

这些相同的原理也适用于边缘的任何连接设备,无论是包括农村太阳能板还是具有GSM(全球移动系统)连接的海洋浮标。无论您公司如何定义“边缘”,Telegraf和InfluxDB都可以处理这些设备的数据收集。

InfluxDB为IIoT系统拥有成熟的生态系统。一些领先的工业系统,包括PTC Kepware、PTC ThingWorx、Siemens WinCC OA和Bosch ctrlX,都使用InfluxDB作为他们的时序平台。这些系统已经存在预配置的集成,因此像向工业4.0过渡的公司这样的公司可以快速轻松地将他们的时序数据库升级到InfluxDB。

将数据输入InfluxDB是管理和利用时序数据的一部分。分析和采取行动同样重要。Flux查询语言与InfluxDB平台的所有组件(即InfluxDB、Telegraf)一起工作。Flux允许您切割和剖析时序数据以产生可操作的见解,设置阈值和警报,并将数据输出到任何期望的端点。通过使用Flux和InfluxDB,您可以创建数据可视化,帮助识别使用模式、优化领域或预测维护。

结论

最终,将开源时序数据库集成到您的工业4.0技术堆栈中,有助于弥合操作技术和信息技术之间的差距,为物理和虚拟工厂提供更全面的可观察性,并提供关于制造过程所有方面的关键数据。InfluxDB这样的解决方案赋予了工业操作员利用数据的能力,为工厂地面的工作人员提供关键信息,并在整个制造过程中增加可衡量的价值。