物联网,大数据和云计算等新兴产业的发展[1]极大地促进了工业自动化的进程。
联网在工业生产过程中通过不同类型的传感器收集的大量信息构成了传感器的大量数据。些数据具有典型时间序列数据的特征。过处理和预测此时间序列数据,他们可以有效地监控自动化生产过程,并防止隐患和改进工业技术。前工业传感器的时间预测研究方法主要分为两类。种是基于统计[2]的经典模型,例如移动平均法,指数平滑法,ARIMA模型和状态空间模型等。于统计模型过于依赖稳定性和稳定性的假设,因此它需要更高的数据并且性别普遍性较弱,因此不适合工业使用。一种类型包括基于机器学习的预测模型,例如KNN回归,SVM回归[3],BP神经网络[4-5]和深度神经网络。中,KNN回归,恒温阀芯SVM回归,BP神经网络结构简单,性能稳定,但预测的准确性受到限制。着云计算和大数据时代的到来,计算能力的提高和训练数据的大量增加为深度学习提供了支持[6]。递归神经网络(RNN)为代表的深层网络[7]具有通用性强,预测精度高的优点,逐渐成为时间序列预测的流行研究方向。实际应用中,传感器数据的规律性主要与长期时间数据有关,但是普通RNN所发生的梯度爆炸或梯度弥散意味着该模型只能在短期的[8]。了解决这个问题,引入了短期长期记忆神经网络[9](LSTM NN或LSTM)。LSTM的长期和短期存储单元可以控制信息积累的速率,并具有预测相关的长期时间序列数据的出色能力。于来自同一工业设备平台的不同类型的传感器数据之间通常存在很强的相关性,因此本文提出了一种基于水平(长距离相关性)和垂直(相关性)信息的改进多元变量。据)。工业LSTM传感器预测时间序列数据的方法。
方法避免了统计方法中数据假设的过度依赖,并具有预测工业传感器同步的通用性。
Connor等。[10]提出了一种基于鲁棒滤波的RNN时间序列预测模型,该模型基于传统RNN算法,与传统的时间序列统计分析方法相比,获得了更好的训练性能。化学习。是,与传统的RNN模型一样,该模型对输入的配置要求很高,并且由于长期依赖的时序预测中存在内部缺陷,因此该模型无法满足更高的精度要求。着深度学习的发展,LSTM被提出作为一种改进的RNN算法。于该算法,建立传感器同步预测模型可以有效弥补普通RNN的不足。训和测试数据是来自瑞典公司的机械负载传感器的时间序列。据集包括来自24种不同类型传感器的时间序列数据,例如在同步时间内的压力,热和电。据收集的总持续时间为6天,时间间隔为1分钟。数据集包括总共24组的8,641个本机数据项,其中包括3个标签数据集和21个连续数据集。1显示了四组传感器数据的可视化特性,水平轴是时间索引,垂直轴是样本值。图1所示,数据具有明显的周期性,并且不同数据之间的相关性也很显着。于三种数据类型,例如油桶的温度,排放过滤器的压力和室外供气单元的温度,对于监控工业生产的正常运行特别重要,因此实验模型将分别预测这三种类型的数据。据预处理包括数据清理,标签数据的热编码和数据规范化。练集前4天包含5760个数据项,而测试集包含2876个数据项。RNN使用具有自动反馈的神经元,并不断获取输入中最后一刻的输出,并且可以学习任意长度的时间逻辑特征。是,在训练的后期,RNN会经历梯度弥散或梯度爆炸,即当时间间隔连续增加时,该神经网络无法学习长途信息。究中要预测的传感器数据具有长期依赖性,为了弥补普通RNN中的空白,本文提出了基于LSTM模型的工业传感器数据预测。LSTM是递归神经网络的一种变体,它是由德国研究人员Hochreiter和Schmidhuber在1997年提出的。STM避免了长期依赖的问题,这归功于目标设计,并在大量实验中证明了其优越性。
普通RNN的单个隐藏层不同,LSTM将信息存储在RNN正常信息流之外的控制单元中,即引入了新的状态单元C门,遗忘门和输出门。
功能设计可描述如下。对工业传感器真实数据的远距离相关性以及不同传感器数据之间的多元相关性,本文提出了一种改进的多变量LSTM传感器同步预测模型。模型的网络结构包括三层:输入层,隐藏层和输出层。中,输入层控制输入数据的格式,隐藏层是包含多个LSTM单元的结构,迭代迭代和权重调整可减少直到收敛的误差。出层将结果恢复为原始数据格式。扑如图3所示。图3所示,输入层将来自预处理工业传感器的时间序列数据转换为可用于监督学习的数据。择时间步长T作为间隔。每小时之前的时间步长数据T用作时间输入,并将与该时间相对应的样本值用作目标输出。据分为输入集和相应的输出集。了使输入数据具有多元性,将24种类型的传感器数据集成到3D数据中:[样本值,时间步长,特性],然后将时间步长用作唯一索引以输入隐藏层。据数据的特性和实验结果灵活地调整掩膜层的数量。文中的数据具有很强的规律性。
多的隐藏层很容易导致过度拟合。此,本文中的模型具有独特的隐藏层结构。公式(1)到(3),我们知道阈值激活函数σ(·)的选择是建立模型的关键。于ReLU函数可以减少梯度分散的问题并且计算速度快,因此选择它作为阈值激活函数。形成多元和多参数的深度神经网络时,过度拟合是一个严重的问题。文将Dropout算法[8]添加到隐藏层。心是在训练过程中从神经网络中随机删除这些单元(及其连接)。
种方法可以有效地缓解过度调整的问题。出层将平均绝对误差(MAE)计算为预测输出i和目标输出yi的损耗函数。MAE是平均误差幅度的清晰度量,适用于比较大多数模型的平均误差[9]。藏层调整由损失函数计算的梯度反向传播公式中的属性值,并使用Adam算法为每次学习迭代生成优化参数,直到损失函数收敛为止。练模型后,输出层对结果执行反归一化,并以与输入匹配的时间序列数据格式恢复预测值。
验分为模型训练和模型测试两部分,分别预测油桶温度,排放过滤器压力和温度的三个时间序列数据集。外电源。入数据的时间间隔T为5,模型形成的时间为50,批量大小为512。同的数据集用于训练和测试模型的模型。变量LSTM预测,BP神经网络,KNN回归和SVM回归作为比较实验。验操作系统为Ubuntu 16.04,编程语言为python2.7,算法平台为Tensorflow。件配置为Intel i7 CPU,内存为8G。中,yi和i表示第i个样本的真实值和预测值,n是样本数。RMAE和MAPE值越小,预测结果越准确。1显示了3个数据集上5个模型的预测结果的比较。了单变量LSTM模型外,其他模型都是多变量输入。据比较结果,多元LSTM在三个测试结果中具有最低的RMSE值,在两个测试结果中具有最低的MAPE值,并且预测误差最小。实验中,训练最快的是KNN回归和SVM回归,但是预测结果包含较大的误差。元LSTM的学习时间少于单变量LSTM的学习时间。际上,Dropout算法降低了多元LSTM模型的网络节点的复杂性,并且ReLU激活函数的计算速度很快。文提出了一种基于LSTM多元分析的工业传感器时间序列数据预测方法,该方法不仅解决了传统机器学习方法的长期依赖问题,而且还使用了依赖关系。
际工业生产平台上几种类型的传感器数据的长期相关性。能,有效提高了预测时间序列数据的准确性。验结果表明,该模型对工业传感器时间序列数据的预测能力优于BP神经网络,SVM回归,KNN回归和单变量LSTM模型。文未来的工作将考虑通过扩展数据集来提高模型的可推广性。
本文转载自
恒温阀芯 https://www.wisdom-thermostats.com