扩展数据收集:使用 InfluxDB 解决可再生能源挑战

导航至

对于数据关键型和数据密集型行业(如能源和可再生能源),获取数据可能关乎成败。随着能源运营系统复杂性的增加,收集和分析数据比以往任何时候都更具挑战性。因此,了解哪些数据源是必要的,它们在技术堆栈中的位置,以及它们如何在组织内扩展,对于能源公司获得维护和优化运营所需的洞察至关重要。

为什么可扩展性很重要

当我们考虑可扩展性时,它要么是横向的,要么是纵向的。这并不是说公司需要选择其中一种;而是说他们的需求往往是独立出现的。

现代能源网格和能源结构的特殊性,需要比旧系统更多的关注。传统的能源生产发生在中心位置,使得跟踪更容易。输入和输出是一致的,并且需要较少的频繁关注。

横向扩展

在可再生能源领域,能源来源的数量和位置通常分布广泛。这意味着能源生产商需要监控更多的“电厂”以及这些来源与电网之间的连接。

由于许多可再生能源是间歇性的,因此必须监控来自各个设备(例如,太阳能电池板、风力涡轮机等)的能源生产和存储。太阳只在白天照射,风力涡轮机只在有风的时候转动!将这些信息输入到机器学习模型中可以帮助优化公司如何使用能源。这一切都需要数据。

此外,还要考虑所有产生能源并将其送回电网的住宅或个体商业设施(例如,太阳能电池板)。能源公司需要精确跟踪这些信息。

纵向扩展

最后,我们需要考虑执行实际监控的系统。公司需要确保他们的运营技术 (OT) 堆栈也保持良好的工作状态。制定一个监视监视者的计划是公司需要考虑的事情。监控这些堆栈需要纵向可扩展性,因为它们会增长并变得更加复杂。

数据挑战

随着系统变得更加复杂和分布化,能源公司的数据工作负载变得更加苛刻。时间序列数据的挑战在于数据量很大。一个积极的方面是,您拥有的数据越多,您可以揭示的洞察就越深入。当我们对一切进行instrumentation时,我们就能洞察这些事物如何运作和变化。我们获得的粒度越细,例如,微秒或纳秒级的精度,这些洞察就越准确。

然而,更深入的洞察也伴随着权衡。首先,您需要一个可以处理和管理高分辨率数据的解决方案。InfluxDB 3.x 是一个时间序列数据库,每秒可以摄取数百万个数据点,并支持纳秒级的数据精度。换句话说,它可以以您的设备生成数据的速度摄取数据并使其可用。(这与传统的数据 Historian 非常不同。)

一旦您拥有高分辨率数据,存储就会成为一个挑战,因为您拥有的数据越多,保存它的成本就越高。当公司想要进行预测和预测分析时尤其如此,因为这些过程需要尽可能多的高分辨率数据来构建和训练支持它们的 AI/ML 模型。

因此,从历史上看,公司可以长期保存高分辨率数据,启用 AI/ML 优化,并花费更多来存储所有数据。或者,他们可以对数据进行降采样,保留聚合数据,并节省存储成本,但会大大限制他们生成洞察或优化并拥抱 工业 4.0 优势的能力。

为时间序列工作负载扩展

当我们将分布式工业运营的现实与数据生成的现实相结合时,很快就会明白为什么可扩展性很重要。端到端监控可能是一个挑战,但未能做到这一点可能会导致不可预测且代价高昂的问题。此外,当我们从整体上看待能源行业时,纵向和横向可扩展性以不同的方式出现。一些公司可能在所有领域都参与,而另一些公司可能选择专注于某个领域。然而,该行业的机遇通常是可扩展性需求的一个函数。

数据标准化和边缘数据复制

在能源生产方面,不乏需要监控的设备和系统。对于风能和太阳能等可再生能源尤其如此。能源生成设备通常使用不同的传感器,即使在同一阵列中也是如此,这可能意味着它们以不同的格式和协议推送数据。为了全面理解这些数据,公司需要对其进行标准化。

在下面的图表中,您可以看到 Telegraf 用于从各种协议(例如,Modbus、MQTT、OPC-UA 等)收集数据,并以 InfluxDB 的线路协议输出。您可以使用边缘的 InfluxDB 单节点实例来完成此操作。现场工作人员可以使用边缘的数据来实时监控本地系统。这些边缘节点使用 InfluxDB 的边缘数据复制 (EDR) 功能来创建一个持久队列,该队列自动将数据发送到中央数据存储。此架构实现了边缘的数据访问和分析,并将其与中心的数据弹性相结合。

架构图,显示了使用 Telegraf 进行数据摄取、单节点 InfluxDB 以及在边缘启用的 EDR,将数据传输到中央枢纽。

能源分配

有很多方法可以将能源从其来源输送到最终目的地,并且沿途有很多东西需要监控。

在更传统的电网中,我们可以看到横向和纵向扩展的现实。在下面的图表中,我们有两个分布式发电站网络,它们构成了一个垂直层和一个水平层。我们在前一层发电站馈送的变电站中看到了相同的情况。您可以在每个工厂设施中使用 InfluxDB 来收集、存储和分析其数据。 这里的目标通常是了解故障发生的时间和地点,以加速维护。这些不是自修复设施,因此可能不需要实时洞察。但是,能源公司仍然希望尽快确定根本原因,以优化其维护人员的计划。有了足够的数据,能源公司可以利用机器学习来预测何时会发生错误,并在排除故障时更加主动。游戏名称是监控、分析、预测和重复。

虚拟电厂

能源的存储和战略性释放是虚拟电厂背后的关键驱动力。每千瓦时能源的成本因一天中的时间而异。高能源使用时段的成本可能比低使用时段高几个数量级。公司可以通过存储在低时段产生的能量,存储它,并在高时段释放它来利用这种情况。

这在实践中是什么样的,数据在其中扮演什么角色?这种情况下的能源生产来源通常是可再生能源,如风能。公司通常将能量存储在电池阵列中。因此,他们不仅需要监控风力涡轮机,还需要监控电池,假设他们控制这些电池。他们需要能够跟踪过程两端的电池性能。这意味着了解能量输入和输出时的电池容量。他们还需要跟踪全天的能源价格,以便他们可以最大化存储能源的成本。

Ju:niz Energy 是一个使用电池存储能量的公司的例子。Ju:niz 开发了智能、大规模的储能系统,每秒收集 130 万个关于电池健康状况、气候、温度和其他条件的数据点。Ju:niz 使用 Modbus 协议连接到现场的 iEMS SPS 控制器。他们使用开源 Telegraf(InfluxDB 的数据收集代理)从控制器收集数据,并将其写入边缘的 InfluxDB 开源实例。Ju:niz 使用 EDR 将来自其所有本地 InfluxDB OSS 实例的数据发送到中央的、AWS 托管的 Cloud Dedicated 集群。要了解更多关于这种类型的储能的信息,请查看关于 ju:niz Energy 的完整案例研究,以了解它是如何工作的以及 InfluxDB 在系统中的位置。

Ju:niz Energy 架构图

在该领域工作的公司还可以控制拥有太阳能电池板的消费者送回电网的能源。在某些地区,公司可以购买个人家庭产生的能源。公司可以提供比公共实体更高的价格来购买个人家庭产生的电力,就像他们可以通过战略性地将能源释放到电网来最大化价值一样。这些公司需要监控通过这些协议进入系统的能源量。

大规模监控能源

这篇文章只是初步探讨了数据、可扩展性和能源行业。但即使是这简短的介绍也表明,在纵向和横向轴向上都存在使用数据进行监控、分析和预测的需求。由于如此多的来源在如此多的层级生成数据,收集、组织和管理这些数据——将其转化为可操作的洞察——的能力变得至关重要。InfluxDB 具有确保能源公司能够看到其系统正在做什么的能力和功能,从数据中获得深入的洞察,并为高级分析 (AI/ML) 提供动力,以优化和改进整个行业的系统和流程。

点击此处 了解更多关于 InfluxDB 及其在能源/可再生能源领域的应用。