基于空间相关和Informer网络的风电功率预测方法
作者: 孙旭 刘界廷
关键词:空间表征;功率预测;Informer网络;稀疏概率自注意力机制;深度学习
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2024)25-0094-03
0 引言
风电作为一种可再生的清洁能源,其技术相对成熟,是目前应用最广泛的新能源发电方式之一。截至2021年底,全球风电累计装机容量中陆上风电占比超过93%,陆上风电新增装机容量占比超过77%[1]。但由于外在条件的间歇性和随机性,风电渗透率的快速增长对电力系统的调度和规划提出了新的挑战,因此对风电场输出功率进行准确的预测是降低风电输出功率不确定性的最有效手段,为大规模风电的有效消纳提供重要支撑。
风电功率预测是一项具有挑战性的任务,因为风力发电受到与风和环境相关的多种因素的影响,以及风力涡轮机的物理条件和特性[2]。在过去的时间里,风电功率预测技术取得了很大进步,例如,GO Kaya混合了经验模态分解(EMD) 和随机森林回归(RFR) 两种算法,并在土耳其的真实风电数据上进行了实验[3];Han L等[4]采用变分模态分解方法将风电数据分解为3 个组成模态,并利用长短期记忆网络深入学习这些模态的特征,提出一种变分模态分解长短期记忆(VMDLSTM)预测方法。近年来,人工智能方法以其高效性和良好的非线性学习能力在风电功率预测领域受到越来越多的关注[5]。Li等[6]结合空间依赖性并通过门控递归单元(GRU) 来提取时间趋势,提出了一种基于编码器-解码器结构的风力发电预测深度学习方法。
不同的方法在不同的测试场合中表现出各自的优势,上述方法虽然能够拟合真实值,但通常缺乏对空间特征的考虑或对时间序列依赖性处理不足。为了解决这些问题,本研究从空间和时间的维度出发,通过K近邻算法融合来自周围风力涡轮机的数据以增强风况知识,完善风电功率预测的物理属性。同时,引用Informer网络模型解决模型对时间序列依赖性不足的问题,其中多头概率稀疏自注意力机制使得模型能够集中关注与当前时间步骤相关的输入数据部分,从而减少对整个输入序列的处理,提高计算效率和模型性能。
在时间维度上,对时间信息进行编码,将每个时间点上的时间单位的值映射到区间上的标准化值。最终,将时间特征向量、空间特征、气压和风向特征合并为历史特征数据,并对其进行时间窗口划分。
2.2 模型
预测模型结构如图1所示。为了使模型能够更好地捕捉历史特征数据与未来时刻输出发电量之间的关系,将输入的特征数据转化为模型的特征嵌入向量。时间特征向量和属性特征向量会分别经过线性层和一维卷积层,被映射为与模型输入和输出维度相匹配的嵌入向量Et , Echa;同时,属性特征向量还会通过计算正弦和余弦函数的组合[8]来生成位置编码向量Epos,最终合并这些向量以获得模型的嵌入向量Em。
Informer网络模型[7]包括编码器和解码器两个部分。编码器负责捕捉历史时间段内的属性特征,其中功率特征向量将作为解码器的输入。与传统的注意力机制Q,K,V 矩阵计算不同,Informer的独特之处在于其稀疏概率注意力机制,它通过与均匀分布进行比较,计算某一时刻与其所在时间区间内其他时间点的相关性分布。差异越大,则该时间点在其所在的时间区间内越相关,反之则越不相关。
在编码器中,相邻的注意力模块之间采用了卷积与池化操作,以对特征进行下采样。这是由于稀疏概率自注意力机制的特殊计算方法可能导致冗余的注意力分数,因此通过这种蒸馏操作来不断捕捉重要特征。
对于Informer的解码器,输入序列的预测部分用0作为mask掩码进行填充。对于概率稀疏注意力中对q 的填充方式,不同于编码器使用V 的均值进行填充,解码器采用累加求和的方式,以防止模型关注未来时刻的功率量。
为了使模型的预测序列与实际观测序列尽可能接近,需要通过计算输出值与实际值之间的误差,使用反向传播算法来调整网络的参数。
3 实验
在本节中,将说明所提出的模型在真实数据集上的表现。该数据集来源于位于巴西东北海岸的Be⁃beribe风电场(UEBB) 。数据集包括从2013年8月至2014年7月32台风力发电机的SCADA数据,采样间隔为10分钟[9]。其中,70%作为训练集,30%作为测试集,预测结果将基于测试集进行评估。图2展示了每台风机风速特征之间的皮尔逊相关性系数矩阵,可以看出机组与机组之间存在一定的潜在联系,这也为空间相关性分析做好了铺垫。
基于该数据集,将所提出的模型Spatial-Informer 与原模型Informer进行了对比,以验证空间特征的有效性。通过引入空间相关性特征,随着近邻机组数量的增加,预测结果的准确性有所提高,但如果近邻机组数量k 选择不合理,也会对预测结果的准确性造成影响。如图3所示,当融合4个近邻机组作为目标风机的空间特征时,误差达到了最低。这表明适当的空间特征融合可以显著提升模型的预测能力。
与经典模型,包括GRU 和LSTM,进行了对比。表1展示了这些模型的性能比较。预测结果使用平均绝对误差(MAE) 和均方根误差(RMSE) 进行评估。
图4展示了风电场中1号风机在某些时间段内测试集上的表现,预测步长为24(4小时)。在图中,红色虚线表示真实值,绿色虚线表示没有引入空间表征的Informer模型的预测值,蓝色实线表示引入空间表征的Spatial-Informer模型的预测值。可以看出,与原先的Informer模型相比,Spatial-Informer模型的MAE降低了7.7%,RMSE降低了8.7%。这说明引入空间表征的Spatial-Informer模型在准确性上具有显著提升,更好地捕捉了空间相关性,从而提高了预测性能。
4 结束语
在本次工作中,提出了一种基于空间相关性和In⁃former网络模型的风电功率预测方法。通过融合目标的近邻属性,并嵌入至Informer网络模型中,该方法能够有效集成空间特征和时间依赖性,更好地捕捉历史特征数据与未来时刻输出发电量之间的预测关系。与原Informer模型和经典模型相比,该方法提高了预测精度。然而,在本次实验中,仅考虑了目标风机的分布,而现实中的气象特征变化与地理位置之间依然存在不确定性因素,因此仍有不足之处。对于未来的工作,将进一步评估空间分布相关性,以提高预测结果的准确性。