数据收集扩展:使用InfluxDB解决可再生能源挑战
作者:Jason Myers / 开发者
2024年6月6日
导航到
对于数据关键和数据密集型行业,如能源和可再生能源,数据访问可以决定成败。随着支撑能源运营的系统的复杂性不断增加,收集和分析这些数据比以往任何时候都更具挑战性。因此,了解哪些数据源是必要的、它们在技术堆栈中的位置以及它们如何在整个组织中进行扩展,对于获得能源公司维持和优化运营所需的洞察力至关重要。
可扩展性为何重要
当我们考虑可扩展性时,它要么是水平的,要么是垂直的。这并不是说公司需要选择其中一个;而是他们的需求往往独立出现。
现代电网和能源源的结构比旧系统需要更多的关注。传统的能源生产发生在中央位置,这使得跟踪变得更容易。输入和输出是一致的,并且需要较少的关注。
水平扩展
在可再生能源领域,源的数量和位置往往分布广泛。这意味着能源生产商需要监控更多的“工厂”,以及这些源与电网之间的连接。
由于许多可再生能源是间歇性的,因此需要监控单个设备(例如,太阳能电池板、风力涡轮机等)的能源生产和存储。太阳只在白天照耀,风力涡轮机只有在有风时才会转动!将这些信息输入机器学习模型可以帮助优化公司使用这种能源的方式。所有这些都需要数据。
还要考虑所有将能源送回电网的住宅或个人商业设施(例如,太阳能电池板)。能源公司需要精确跟踪这些信息。
垂直扩展
最后,我们需要考虑实际监控的系统。公司需要确保他们的运营技术(OT)堆栈保持良好状态。制定一个监控监控者的计划是公司需要考虑的事情。随着这些堆栈的增长和变得更加复杂,监控它们需要垂直可扩展性。
数据挑战
随着系统变得更加复杂和分布式,能源公司的数据工作量也变得更加庞大。时间序列数据面临的挑战在于数据量巨大。一个积极的方面是,数据越多,你能够揭示的见解就越深。当我们对一切进行测量时,我们就能够了解这些事物的运行和变化方式。我们越细致,例如,达到微秒或纳秒的精度,这些见解就越准确。
然而,更深入的见解也伴随着权衡。首先,你需要一个能够处理和管理高分辨率数据的解决方案。《InfluxDB 3.x》是一个时间序列数据库,每秒可以处理数百万个数据点,并支持纳秒级数据精度。换句话说,它可以将数据以设备生成数据的速度摄取并使其可用。(这与传统的数据历史记录器截然不同。)
一旦拥有高分辨率数据,存储就成为一个挑战,因为数据越多,存储成本就越高。这在公司进行预测和预测分析时尤其如此,因为这些过程需要尽可能多的高分辨率数据来构建和训练支撑它们的AI/ML模型。
因此,从历史上看,公司可以选择长期存储高分辨率数据,实现AI/ML优化,并为此付出更多存储成本。或者,他们可以降低数据采样率,保留汇总数据,节省存储成本,但会大幅限制他们产生见解或优化和利用工业4.0提供优势的能力。
时间序列工作负载的扩展
当我们结合分布式工业操作的现实和数据生成的现实时,很快就清楚为什么可扩展性很重要。端到端监控可能是一个挑战,但未能做到这一点可能导致后续出现不可预测和代价高昂的问题。此外,当我们从整体能源部门来看时,垂直和横向可扩展性以不同的方式出现。一些公司可能在所有领域都参与,而另一些公司可能选择专业化。然而,这个部门的机遇通常与可扩展性的需求有关。
数据归一化和边缘数据复制
在能源生产方面,有大量需要监控的设备和系统,尤其是对于风能和太阳能这样的可再生能源。能源生成设备通常使用不同的传感器,甚至在同一阵列中,这意味着它们可能以不同的格式和协议推送数据。为了全面理解这些数据,公司需要对其进行归一化。
在下图中,您可以看到Telegraf用于从各种协议(例如,Modbus、MQTT、OPC-UA等)收集数据,并以InfluxDB的行协议输出。您可以使用单个节点实例的InfluxDB在边缘完成此操作。现场工作人员可以使用这些数据实时监控本地系统。这些边缘节点使用InfluxDB的边缘数据复制(EDR)功能创建一个持久队列,自动将数据发送到中央数据存储。这种架构在边缘实现了数据访问和分析,并将其与中心的数据弹性相结合。
架构图显示了Telegraf、单个节点InfluxDB和启用边缘EDR的数据摄取,将数据传输到中央枢纽。
能源分配
有无数种方法可以将能源从源头输送到最终目的地,沿途有大量需要监控的事物。
在更传统的电力系统中,我们可以看到水平和垂直扩展的现实。在下面的图中,我们有两个分布式发电站网络,它们组成一个垂直层和一个水平层。我们还可以看到在上一层的发电站供电的变电站所呈现的相同情况。您可以在每个工厂设施内使用InfluxDB来收集、存储和分析其数据。目标通常是为了理解故障何时何地发生,以加快维护工作。这些设施并非自我修复,因此实时洞察可能并非必需。然而,能源公司仍然希望尽可能快地识别根本原因,以优化其维护人员的日程安排。有了足够的数据,能源公司可以利用机器学习来预测错误何时发生,并在故障排除方面更加积极主动。关键在于监控、分析、预测和重复。
虚拟电厂
存储和战略释放能量是虚拟电厂背后的关键动作。每千瓦时的能源成本因一天中的时间而异。高峰时段的能源使用成本可能比低峰时段高出一个数量级。公司可以通过在低峰时段存储产生的能源,并在高峰时段释放它来利用这种情况。
在实践中,这看起来是什么样子?数据在这个故事中扮演什么角色?在这种情况下,能源生成源通常是可再生能源,如风能。公司通常将能源存储在电池阵列中。因此,他们不仅需要监控风力涡轮机,还需要监控电池,前提是他们控制这些电池。他们需要在过程的两端跟踪电池的性能。这意味着要了解电池的容量,即能源进来和出去时的容量。他们还需要跟踪全天的能源价格,以便最大化存储能源的价值。
Ju:niz Energy是一家使用电池存储能源的公司的例子。Ju:niz开发了智能的大型能源存储系统,每秒钟收集1.3M个关于电池健康、气候、温度和其他条件的数据点。Ju:niz使用Modbus协议连接到现场iEMS SPS控制器。他们使用InfluxDB的数据收集代理Telegraf从控制器收集数据,并将其写入边缘的一个开源InfluxDB实例。Ju:niz通过EDR将其所有本地InfluxDB OSS实例中的数据发送到一个中央、由AWS托管的Cloud Dedicated集群。要了解更多关于这种能源存储的信息,请查看Ju:niz Energy的完整案例研究,以了解其工作原理以及InfluxDB在系统中的位置。
Ju:niz Energy架构图
在这一领域工作的公司还可以控制拥有太阳能板的消费者向电网反馈的能源。在一些地区,公司可以购买由个别家庭产生的能源。公司可以提供比公共实体更高的价格来购买个别家庭产生的电力,就像他们通过战略性地将能源释放到电网中来最大化价值一样。这些公司需要监控通过这些协议进入系统的能源量。
大规模监控能源
这篇帖子关于数据、可扩展性和能源领域只是触及了表面。但即便如此,这也足以表明,在垂直和水平两个方向上,都存在使用数据来监控、分析和预测的需求。在如此众多来源和层面生成数据的背景下,收集、组织和管理工作数据——将其转化为可执行的洞察力——变得至关重要。InfluxDB具备所需的功能和特性,确保能源公司能够了解其系统正在做什么,从数据中提取深入见解,并利用高级分析(AI/ML)优化和改进整个行业的系统流程。
点击这里 了解更多关于InfluxDB及其在能源/可再生能源方面的应用。