《水利水电技术(中英文)》官网网址https://sjwj.cbpt.cnki.net
摘 要:
【目的】临近降水预报是涉水灾害预警、洪水预报和调度管理等依赖气象预报决策的重要基础。高精度、高时空分辨率的气象雷达观测能够有效捕捉天气过程变化,发展基于雷达回波外推的临近降水预报方法,是中小流域高精度雨洪预报预警的关键。【方法】以银川贺兰山地区2017—2020年的C波段天气雷达和地面降水资料为基础,开展了ConvLSTM、ConvGRU和PredRNN三种卷积循环神经网络模型在不同降水情景下的预报性能研究,并将三种模型的预报结果与基于半拉格朗日外推的光流法进行对比分析。研究采用临界成功指数(CSI)、命中概率(POD)、虚警率(FAR)、均方根误差(RMSE)和结构相似性指数(SSIM)5种指标评估了三种模型在不同天气系统发展过程中的预报能力。【结果】结果显示:ConvLSTM模型可以较好的预测回波变化过程,而PredRNN模型对回波驻留和发展的过程预报效果较好;随着雨强的增大、预报时长的增加,卷积循环神经网络模型对回波运动的捕捉能力和回波强度变化的预测能力显著强于光流法;ConvLSTM模型能够更好的预报中小雨天气过程,结构更加复杂的PredRNN模型对暴雨过程具有更好的预报效果。【结论】结果表明:三种卷积循环神经网络模型中,ConvLSTM和PredRNN模型的预报效果优于结构较为简单的ConvGRU模型,且三种模型均优于光流法;在实际的应用中,1 h之内的预报可优先考虑ConvLSTM的预报结果,1 h后的预报则应更关注PredRNN模型的预报结果;三种卷积循环神经网络模型随预报时长的增加均出现“模糊化”“平滑化”的现象,需要从模型结构、训练方式等多方面进行改善。
关键词:
卷积循环神经网络;临近降水预报;雷达回波外推;深度学习;降雨;极端降水;气候变化;
作者简介:
王永灿(1995—),男,硕士研究生,主要从事水文水资源研究。
*魏加华(1971—),男,教授,博士,主要从事水资源、水信息研究。
基金:
国家自然科学基金项目(51909130);
宁夏重点研发计划项目(2020BCF01002);
水联网联合研究院项目(SKL-IOW-2020TC2004-02);
引用:
王永灿, 魏加华, 李琼, 等. 基于雷达回波的临近降水预报卷积循环神经网络模型研究[J]. 水利水电技术(中英文), 2023, 54 (1): 24- 41.
WANG Yongcan, WEI Jiahua, LI Qiong, et al. Radar echo-based study on convolutional recurrent neural network model for precipitation nowcast[J]. Water Resources and Hydropower Engineering, 2023, 54(1): 24- 41.
0 引 言
近年来,受气候变化和人类活动影响,极端降水导致的山洪、城市内涝等灾害频发,如2021年郑州“7·20”暴雨、2018年银川“7·22”暴雨,导致严重的内涝和山洪灾害。降水临近预报是指对局部地区的降水系统发展和演变过程进行精确、及时的预测,实现未来0~2 h的降水预报。临近预报的精度、时空分辨率是水文、气象领域关注的重点。短历时强降水天气致灾性强,因其尺度较小且历时较短(<2 h),预报具有相当大的挑战。
数值天气预报和基于空基或地基探测的雷达回波外推是降水临近预报的常用方法,尤其是后者基于回波的外推,具有较高的精度和可靠度,是降水临近预报的主要方法。我国正加快推进测雨雷达试点应用,实现超高时空分辨率短临暴雨预警,以提高以降水、径流为重点的洪涝灾害监测预报预警水平。基于半拉格朗日(RPM-SL)平流方案的传统雷达回波外推或遥感图像外推,如质心跟踪法、交叉相关法(TREC)、光流法(OF)等,是通过计算雷达或卫星回波运动场的光流,并在运动场中添加随机扰动,从而实现降水的概率或确定性预报,该方法耗用计算资源少且运算快,在1 h内的预报精度较高,已成为短临降水预报业务化应用方法,但其依赖于平流方程,难以很好地解决降水云的发展和衰减过程,1 h后的回波外推精度快速下降,外推时长受限。
降水短临预报属于典型的时间和空间预测问题,随着AI技术的快速发展,尤其是深度学习(Deep Learning, DL)在计算机视觉、时序问题的处理中都取得了突破性进展和应用效果。深度学习类方法能够从大量历史的气象卫星、雷达数据中挖掘出空间和时序变化特征,获得精度更高且更适合局地灾害天气系统的临近预报模型。2015年,SHI等提出了卷积计算与循环神经网络相结合的ConvLSTM模型,是最早的基于深度学习的降水临近预报模型,可同时学习雷达回波序列的时间和空间信息,准确率和效率优于光流法。2016年,BALLAS等基于GRU模型,在计算权重时使用卷积计算替代矩阵乘积提出了ConvGRU模型,2017年,SHI等对ConGRU模型进行了改进,提出了TrajGRU深度学习模型,通过增加时空可变的结构,并采用了加权的损失函数对模型进行优化。2018年,SATO等将LOTTER在2016年提出的PredNet模型用于降水的短临预报,并在模型中引入了跳跃连接结构及空洞卷积以提升训练效果。WANG等提出了由ST-LSTM单元组成的PredRNN模型,该模型在ConvLSTM模型的基础上加入了一个隐藏状态M,用状态M将上一时刻顶层的时空信息流入到此时刻的底层,建立层与层之间的时空信息联系,该模型相较于ConvLSTM模型改善了时空预测的效果。2018年,WANG等提出了PredRNN++模型,将ST-LSTM结构中两个级联的状态M整合成一个状态,构建了新的Casual LSTM结构单元,从而提高了时空序列预测精度,增加了时空信息学习的深度,减缓了PredRNN模型中梯度消失的问题,但模型的计算复杂度和训练难度随之增加。
PredRNN模型取得了比ConvLSTM与ConvGRU模型更高的预报精度,考虑不同模型在计算复杂度、内存需求及训练难易程度方面的不同,构建基于卷积循环神经网络的区域本地化雷达降水临近预报模型,采用不同的损失函数组合,并开展模型的综合应用和评价,对深度学习降水临近预报的区域应用具有一定的参考价值。本文基于银川雷达和降水观测资料,构建基于PredRNN、ConvLSTM、ConvGRU的本地化雷达降水临近预报模型,并与业务化常用的光流法进行对比分析,开展模型的综合评价,探讨经典的卷积时序深度学习模型实际应用的性能以及未来改进的方向。
1 数据和方法
利用银川气象雷达历史观测数据,在数据质量控制的基础上,构建雷达回波数据集。分别构建卷积时序深度学习的雷达回波外推模型,包括ConvLSTM、ConvGRU和PredRNN,开展卷积循环神经网络的雷达回波外推试验,并以常用的光流法回波外推结果为参照,进行综合的模型性能评价,研究思路如图1所示。

图1 研究思路及方法
1.1 研究区概况
研究区域位于贺兰山东麓,如图2所示,地理坐标104°E—107°E和37°N—40°N,海拔1 000~3 600 m。地处季风边缘区,降水年际变化率大,受贺兰山地形抬升影响,研究区是宁夏极端降水多发区,24 h降雨量大于50 mm的暴雨发生次数占全年的80%以上,暴雨历时短、强度大,降雨量年内分配不均,多以暴雨的形式集中出现在7—8月。贺兰山东麓有大小山洪沟90余条,集水面积从3 km2至数百平方千米不等,沟短坡陡,多为季节性河道,汛期易生山洪、泥石流、崩塌和山体滑坡等灾害。

图2 研究区域示意
1.2 数据
研究区有银川站C波段多普勒天气雷达一部,地面雨量站点254个。该雷达波长1.5~3.75 cm, 频率4 000~8 000 MHz, 采用VCP21体扫模式,可在5~6 min完成9个仰角的扫描。本文利用2017年至2020年每年雨季(6—9月)的雷达反射率因子(Z)数据,经过编码转换、杂波抑制、衰减订正、地物遮挡订正、坐标转换后的反射率混合扫描数据,分辨率为1 km×1 km。根据数据质量控制和统计分析,选择记录完整的28场次降水过程数据为研究对象,构建数据集,数据中包含小雨和中雨6场,大雨10场,暴雨12场。
选取降水过程中连续3 h不间断的雷达回波图像数据作为一组样本数据,并对数据进行切片处理,将一组切分为10张回波图像作为模型训练的输入数据,20张回波图像作为模型训练的输出数据,回波图像时间间隔为6 min, 即模型输入为过去1 h的雷达图像,输出为预报的未来2 h的外推结果,预见期为2 h。共计得到总样本804组,其中,训练集642组(80%),包括小雨和中雨108组,大雨211组,暴雨323组;测试集162组,包括小雨和中雨28组,大雨53组,暴雨81组。此外,选择独立于28场场次降水之外的2个典型降水场次对模型预测结果进行效果评价分析,分别为2022年6月21日暴雨与2018年7月22日特大暴雨降水过程。
1.3 卷积时序类深度学习方法
采用ConvLSTM、ConvGRU和PredRNN三种卷积时序类深度学习模型,均利用Seq2Seq(Sequence to sequence)模型结构[见图3(a)],其中黑色线为卷积循环网络结构中的输出与中间状态的传递过程,红色线为PredRNN模型中M状态的传递过程。Seq2Seq结构由编码器(Encoder)和解码器(Decoder)组成,Encoder将一个序列编码为一个固定长度的向量,Decoder将该向量解码为另一个序列,Seq2Seq结构的优点在于输入和输出的长度均可变,且不需要相同。结构中RNN部分可以是ConvLSTM[见图3(b)]、ConvGRU[见图3(c)]和PredRNN[见图3(d)]三种单元结构中的任意一种。

图3 基本卷积循环网络结构、ConvLSTM单元结构、ConvGRU单元结构和PredRNN单元结构
其中,ConvLSTM是专门针对时空序列设计的深度学习模块,为CNN与LSTM模型在底层的结合。SHI等将神经元内部状态与状态传递的计算方法由矩阵乘法运算改为卷积计算,使其不仅能够捕获到时序上的相关性,还能够像卷积层一样抓取空间特征。ConvLSTM具有遗忘门ft(Forget Gate)、输入门it(Input Gate)和输出门ot(Output Gate),Ct是记忆细胞,如图3(b)所示。计算过程为

式中,“*”为卷积操作;“×”为哈达玛积,下同;it、ft、ot分别为t时刻的输入调制门、遗忘门和输出门结构;xt为t时刻的输入数据;Ht为t时刻的隐藏状态变量;ct为t时刻的时序状态变量;W为需要学习的参数;b为偏置项;σ、tanh分别为Sigmoid和双曲正切激活函数,下同。
GRU是LSTM的变体,如图3(c)所示。GRU的特点是减少了门控单元,将单元状态和输出合并,通过更新门和重置门建立不同时间序列网络信息间的传递和连接。ConvGRU将卷积与GRU融合,通过将各节点中的运算改为卷积计算,使模型具备提取时间和空间特征的能力。计算过程为

式中,zt,rt分别为t时刻的更新门和重置门;xt为t时刻的输入数据;Ht为t时刻的隐藏状态变量;W为模型需要学习的参数。
基于Seq2Seq结构的ConvLSTM和ConvGRU模型,输入帧进入最下层,视频序列产生在最上层,在这个过程中,空间信息随着每层的卷积结构被逐步编码,而时间信息不在层与层之间传递,这样最下层就会忽略之前时间步中最上层的时间信息,这也是ConvLSTM层与层之间独立的缺点。为克服该缺陷,WANG等提出了基于ST-LSTM单元的PredRNN模型,在ConvLSTM基础上引入了M状态,用M状态将上一时刻顶层的时空信息流入到此时刻的底层,如图3(d)所示。计算过程如下


式中,上标l为模型层数;it,gt,ft,ot分别为t时刻的输入门,调制门、遗忘门和输出门结构;i′t,g′t,f′t分别为t时刻M状态的输入门,调制门和遗忘门结构;xt为t时刻的输入数据;Ht为t时刻的隐藏状态变量;W和W′为模型需要学习的参数;b和b′为偏置项。
1.4 光流法
光流法是雷达回波外推降水临近预报的常用方法。光流法通过计算雷达图像在时间上的变化和相邻帧之间的相关性来计算相邻帧之间雷达回波的运动信息。PySTEPs是一个开源的Python库,内置了局部LK(Lucas-Kanade)法、全局变分回波跟踪法和光谱法三种方法,其预报效果无明显差异,本文选用LK光流法作为参照。
1.5 模型训练
卷积时序类深度学习降水临近预报,随着预报时长的增加常出现回波模糊和强降水被低估的现象,原因在于深度学习架构通常选择平均平方误差(MSE)或平均绝对误差(MAE)作为损失函数,通过损失函数的平均效应来处理不确定性,随着预报时长的增加不确定性不断累积,导致预测随着时间步长的增加降水预测图像模糊,这种平均效应引起的图像模糊可视为条件偏差(CB),可通过损失函数的优化选择加以改进。如,利用平衡均方误差 (B-MSE)、平衡平均绝对误差(B-MAE)等,在训练过程中为强降水分配更多的权重,以改善模型适应较强降水的预报性能。AYZEL等采用Logcosh 作为损失函数,相比于应用更广泛的MSE损失函数,能同时考虑到小雨和大雨的预报精度。CHEN等使用MULTI-SIGMOID损失函数获得了比交叉熵损失函数更高的模型收敛性能。TRAN等将图像质量评价(IQA)的指标结构相似度SSIM和MS-SSIM用于损失函数,对克服临近预报的条件偏差和提高预测性能有显著改善。文中模型训练采用了以下损失函数。
(1)MAE损失函数。
平均绝对误差(Mean Absolute Error, MAE)是最常用的回归损失函数,计算方法是求预测值i与真实值yi之间距离的差的绝对值,公式如下

MAE损失函数倾向于模拟单峰分布,对于多峰分布的雷达图像效果不佳,且MAE损失函数倾向于对平均值的预报,极端天气下的降雨临近预报效果不佳。
(2)SSIM损失函数。
图像结构相似性(Structural Similarity, SSIM)是衡量图像相似度的指标,给定两个图像x和y,两张图像的结构相似性公式为

SSIM的值越大,两张图像的相似度就越高,一般采用1-SSIM作为损失函数。
SSIM损失函数容易导致亮度的改变和颜色的偏差,但它能保留更多图像细节,而MAE损失函数能较好的保持亮度和颜色不变化。因此,本文采用SSIM+MAE的复合损失函数用于卷积循环网络模型的训练,计算公式为

式中,α为损失函数的权重,通过多次试验得出最佳结果,系数10用于平衡两种损失函数的数量级。
模型试验环境基于Linux操作系统,CPU为Intel(R) Xeon(R) Gold 6242。显卡为NVIDIA Tesla T4,单块显存16 G。程序运行环境为Pytorch 1.9,python3。训练方法采用计划采样(Scheduled Sampling)法。
1.6 试验设计
试验所采用的模型以过去时刻连续的10张雷达回波图像为输入,未来连续20张图像为输出,即对未来0~2 h的天气作出预报。其中,输入是10张连续的图像,图像的长和宽均为200,即10×200×200的张量,输出是20张连续的图像,图像的长宽均为200,即为20×200×200的张量;ConvLSTM模型,采用的层数为4层,每层卷积核的个数为128,卷积核大小为5×5;ConvGRU模型,采用的层数为3层,每层卷积核的个数为128,卷积核大小为3×3;PredRNN模型的超参数设置与ConvLSTM相同。
1.7 评价指标
采用CSI、FAR、POD、RMSE、SSIM等指标进行外推质量的定量评价,各项指标代表的物理意义及计算方法如表1所列。

表1中,前三种指标使用一个阈值将回波图像和预测图像转换为0/1矩阵,其中大于阈值的格点为1,小于阈值的格点为0,并计算TP(预测=1,真值=1),FP(预测=0,真值=1)以及FN(预测=1,真值=0)。RMSE,yi和y′i分别表示实测值和预测值。SSIM,x、y为两张图像的像素值,μx为x的均值,μy为y的均值,σ2x为x的方差,σ2x为y的方差,σxy为x和y的协方差,C1=(K1L)2、C2=(K2L)2,L是像素值的范围,为0~75,K1=0.01,K2=0.03。
2 结果和讨论
2.1 典型降水过程预报分析
选取数据集之外的2个典型场次降水过程:2022年6月21日(以下简称“6·21”降雨)为瞬时强对流过程;2018年7月22日(以下简称“7·22”降雨)为以地形作用为主的短时强对流降雨过程,造成了较大人员财产损失。“6·21”天气过程主要为小范围高强度降水,降水主要集中在银川市区,造成部分地区出现城市内涝现象,降水过程持续3~4 h, 部分地区降水强度超过50 mm。雷达回波显示从城市中心处由一点扩散为两片高强度回波中心,且回波由西向东移动,逐渐扩散并消亡,回波强度最高超过50 dBZ,是一次典型的对流降水过程。“7·22”天气过程持续29 h, 其中降水主要发生在22日18时至23日06 时,8个站点降雨量大于100 mm, 2个站点实测降雨大于200 mm, 为特大暴雨,暴雨雨带主要集中在贺兰山东麓中北段,受贺兰山地形影响明显。雷达回波变化主要分为两个阶段:第一阶段主要发生在22日18—19时,其特征为回波发展缓慢,回波单体移动缓慢,回波主要集中在银川东部地区;第二阶段主要发生在19时之后,回波沿贺兰山强度迅速增加,并且在自南向北的移动过程中不断有新的回波生成,造成“列车效应”,导致贺兰山东麓持续有高强度的带状回波。
图4—图8为“6·21”降水回波实况与不同方法预报结果的对比,从真实图像可以看出,回波变化主要为自西向东缓慢移动同时伴随有两个高强度回波中心逐渐生成。从回波轮廓反演方面,光流法在前30 min的预报效果较好,但随着时间推移,其预报结果的可信度在1 h后迅速降低,回波自始至终只表现出了自西向东的缓慢移动,对回波形态的变化无法预测;ConvLSTM对回波轮廓的预测要优于ConvLSTM与PredRNN模型;ConvGRU模型与PredRNN模型在前30 min保留的细节较多,但随着时间推移雷达回波区域逐渐减弱,无法正确预测新回波的生成。对雷达回波中心的预报,光流法的预报结果偏差较大,ConvLSTM成功刻画出了图像中部的两个回波中心,但结果偏小,且对上侧回波中心的预报位置有一定的偏差,而PredRNN模型与ConvGRU模型无法预报上侧新生成的回波中心,且对下侧回波中心的预报结果明显偏小。

图4 “6·21”降水过程雷达回波实况与预报结果对比(6 min)

图5 “6·21”降水过程雷达回波实况与预报结果对比(30 min)

图6 “6·21”降水过程雷达回波实况与预报结果对比(60 min)

图7 “6·21”降水过程雷达回波实况与预报结果对比(90 min)

图8 “6·21”降水过程雷达回波实况与预报结果对比(120 min)
图9—图13为“7·22”降水场次的预报结果与真实回波的对比。从图中可以发现,回波轮廓方面,光流法的外推结果在30 min时已出现较大偏差;ConvGRU预测出了图像西部的回波变化趋势,但回波位置出现较大偏差;ConvLSTM和PredRNN做出了较好的预报,其中ConvLSTM对高强度回波的预报较为准确,PredRNN对回波轮廓预报更为准确,但对回波强度有所低估。回波中心的预报,光流法的预报结果在前30 min有一定的精度,随着预报时间的延长其预报精度快速下降;ConvGRU对快速变化的回波预报能力不足,30 min后预报的回波中心逐渐失真且强度相差较大;ConvLSTM和PredRNN对较长预报时间的回波中心具有一定的预报能力,其中ConvLSTM的预报结果与真实值在强度上较为接近,但位置上差别较大,而PredRNN模型对回波中心的位置把握较为精确,但在强度上低估较多。

图9 “7·22”降水雷达回波实况图像与预报结果对比(6 min)

图10 “7·22”降水雷达回波实况图像与预报结果对比(30 min)

图11 “7·22”降水雷达回波实况图像与预报结果对比(60 min)

图12 “7·22”降水雷达回波实况图像与预报结果对比(90 min)

图13 “7·22”降水雷达回波实况图像与预报结果对比(120 min)
表2为不同方法预报结果的量化评价。在三种卷积循环神经网络算法中,PredRNN的综合效果较弱,ConvLSTM在CSI与POD上表现较好,ConvGRU在FAR与RMSE上表现较好。对比“6·21”和“7·22”不同降水类型预报结果评价指标可以发现,卷积循环类模型的预报结果整体优于光流法,其中对于“6·21”雷达回波快速生成和消亡的天气过程,ConvLSTM与ConvGRU效果更好;而“7·22”回波范围大、高强度回波占比高、降水持续时间长的天气过程,PredRNN表现出了更好的预报效果,且四种模型对“6·21”回波快速生成过程的预报能力均有一定的缺陷,效果弱于同种模型对“7·22”降雨过程的预报。

卷积循环神经网络模型中,ConvLSTM模型的计算结果有高估的现象,且对变化较快的回波预测能力较弱,ConvGRU模型预报效果有“均化”现象,可以较好的刻画回波轮廓的变化,但对回波位置变化的预测能力偏弱。PredRNN模型,对回波位置变化、回波强度变化均有较好的预测能力,但对回波生成过程的预报能力较弱。光流法对回波强度变化的预报能力较差,预报能力均弱于卷积循环类模型。卷积循环类模型随预报时间延长,均出现图像模糊的现象,主要原因:一是时空信息的损失,随着预报时间的延长,信息损失越多;二是雷达回波的移动和生消受风速风向、温度、地形等影响,仅使用雷达回波图像作为模型输入无法准确预测雷达回波的变化,尤其对雷达回波从无到有的生成过程,基于单一数据源的三种卷积循环神经网络模型预报效果均较弱;三是深度学习在训练过程中总是趋于平均整幅图像的误差,使得其在预报后期雷达回波的数值会趋于均化,造成视觉上的“模糊”。
2.2 模型综合性能评价
为了对不同模型在不同预报时长的预测结果做出精细化对比,对模型在训练集与测试集上的结果通过五种指标进行评价。图14为不同模型在训练集上的整体评价结果(其中,FAR做(1-FAR)处理,RMSE做(1-RMSE/9.525 dBZ)处理,使五种指标均以1为最优值,且指标范围均在0~1之间,图15、图16同),从图中可以看出在前60 min的预报结果中,ConvLSTM的效果最好、ConvGRU与PredRNN的效果较为接近,随着预报时间的延长,三种卷积循环神经网络的模型差距逐渐减小,说明在训练过程中,ConvLSTM对训练集的拟合效果更好,ConvGRU与PredRNN的拟合效果要弱于ConvLSTM。

图14 训练集中CSI、FAR、POD、SSIM和RMSE随时间变化的值

图15 测试集中CSI、FAR、POD、SSIM和RMSE随时间变化的值(处理方式同图6)

图16 四种模型在不同雨强下的CSI、FAR、POD、SSIM和RMSE随时间变化的值(处理方式同图14)
图15为模型在测试集上的整体评价结果,从图中可以看出,与光流法相比,卷积循环神经网络方法在所有时长的预报指标均优于光流法,卷积循环类模型的雷达图像外推方法可以较充分的从历史数据中学习其变化规律,相较于光流法具有明显优势。前30 min各类卷积循环神经网络算法的预报能力较为接近,其中ConvLSTM表现最好,ConvGRU模型略优于PredRNN模型,这种差异可能与模型结构有关,PredRNN新增的M状态使其可以保留更长时间的记忆,而ConvLSTM和ConvGRU则更关注于近期的模型输入。随着预报时间的延长,30 min后,ConvGRU的预报能力出现快速下降,这与ConvGRU简化了ConvLSTM的模型结构有关,在加快了训练速度的同时降低了其对长时间高复杂度的回波序列的预报能力,而PredRNN模型在SSIM之外的指标中均变化较慢,以RMSE为例,在30 min~60 min, PredRNN的RMSE指标仅下降了0.51 dBZ,而ConvLSTM和ConvGRU则下降了1.66 dBZ和1.55 dBZ,说明随着预报时间的延长,PredRNN更加复杂的模型结构有助于其在较长时间序列上的预报。当预报时长为120 min时,PredRNN预报结果的所有指标均优于其它方法,ConvLSTM次之,ConvGRU在卷积循环神经网络模型中效果最差,但仍优于光流法。
为了探讨模型对不同降水强度的预报能力,将测试集中预测的结果按雨强进行分类,统计分析不同雨强、不同预报方法在不同预报时长的效果。图16为四种模型在不同降雨类型、不同预报时长的对比图。在小到中雨雨强的情况下,根据各模型指标随时间的变化(见图16)可以看出,在小中雨的天气下,前90 min的预报中ConvLSTM模型的预报效果最好;当预报时长为120 min时,PredRNN的预报效果与ConvLSTM模型基本相同,且两模型在所有预报时长下均优于光流法和ConvGRU模型。在大雨的天气下,四种模型的预报效果与在小中雨天气下基本一致,ConvLSTM、PredRNN模型均优于ConvGRU和光流法。当天气类型为暴雨时,在预报初期(30 min),ConvLSTM效果较好,PredRNN和ConvGRU的效果相近,且三种卷积循环神经网络模型均优于光流法;当预报时长较长(90 min、120 min)时,PredRNN模型超过ConvLSTM模型,成为四种模型中预报精度最高的模型,在暴雨天气下的所有预报时长中,ConvGRU和光流法表现均较弱。
ConvLSTM模型在预报时长60 min之内时[见图16(a)和(b)],对三种降水类型下的预报效果基本一致,预报时长超过60 min[见图16(c)和(d)]后,对大雨天气下的预报能力略优于其余两种降水类型;ConvGRU模型对不同天气状况、不同预报时长的变化规律与ConvLSTM相近,都表现为在预报前中期对不同降水类型的预报效果基本一致,预报后期对大雨天气下的预报能力略优;PredRNN模型在预报前期[见图16(a)]对中小雨和大雨天气下的预报能力要优于暴雨天气,随着预报时间的延长,PredRNN模型在60 min时[见图16(b)]对三种天气类型的预报精度基本一致,当预报时长为90 min及120 min时[见图16(c)和(d)],PredRNN模型的预报效果会随着雨强的增大而增大,表明其对回波强度较高、变化较快的回波类型的预报能力较好。
3 结论和展望
构建了ConvLSTM、ConvGRU和PredRNN三种卷积循环神经网络模型,利用贺兰山地区2017—2020年的雷达和降水资料,对不同雨强下的模型性能进行了探讨,主要结论如下。
(1)卷积循环神经网络模型对时空序列预测问题具有较强的学习能力。与光流法相比,对于变化较慢的小到中雨的天气情况,光流法和卷积神经网络模型预报结果相近;随着雨强的增加、预报时长的增加,卷积循环神经网络模型的预测能力要显著优于光流法。对比不同强降水过程雷达回波变化特征(地形作用以及瞬时强对流)下各模型的预报效果,对局地快速生成发展的雷达回波变化过程,ConvLSTM模型的预报效果较好,成功预报出两个回波中心,但在强度上误差较大,PredRNN模型与ConvGRU模型对回波的生成过程预报能力较弱;对回波范围大、回波持续时间长的雷达回波变化与发展过程,PredRNN模型的预报效果较好,尤其可以刻画出“列车效应”下回波的驻留过程,ConvLSTM模型对回波强度的变化则有高估现象,且对回波中心位置的预报有一定的误差。
(2)对比三种卷积循环神经网络的深度学习模型,基于LSTM结构的ConvLSTM和PredRNN的预报效果要显著优于ConvGRU模型,与作为ConvGRU模型基础的GRU结构相比,LSTM结构具有更复杂的网络结构,其对复杂的雷达图像具有更好的预测能力。ConvLSTM和PredRNN预报效果相近,对持续变化回波的预报,PredRNN预报效果更好,对回波从无到有的生成过程,ConvLSTM的预报效果更好,但随着预报时间的延长,ConvLSTM对回波强度有高估的现象。
(3)综合三种天气状况下的预报效果,ConvLSTM和PredRNN在大部分天气类型、预报时长中均优于ConvGRU和光流法。ConvLSTM在中小雨和大雨天气的预报能力更优,PredRNN对回波强度大、回波变化快的暴雨天气过程预报结果更为稳定,在预报的中后期(90~120 min)表现更好。ConvGRU模型结构较为简单,对变化复杂的雷达回波预报能力在三种卷积循环神经网络中最弱,但仍优于光流法。1 h之内的预报,ConvLSTM的效果在三种卷积循环神经网络中表现最好;1 h之后的预报,PredRNN在暴雨天气过程中效果更好,在中小雨的天气过程中与ConvLSTM效果相似,因此在实际的应用中,1 h之内的预报可优先考虑ConvLSTM的预报结果,1 h后的预报则应更关注PredRNN模型的预报结果。
(4)卷积循环神经网络模型在两个典型案例中表现了较高的预测效果,随预报时长的增加均出现模糊的现象,这与模型在学习过程更倾向于学习整张图像的平均误差导致的“均化”有关,缺乏对雷达回波细节的刻画,更注重于雷达回波整体形态的变化。
深度学习类方法在雷达回波临近降水预报方面展示出较光流法更为显著的优势,但出现随着预报时长增加会逐渐出现“模糊化”“平滑化”的现象,导致其很难正确预测到小范围的强回波;并且深度学习模型给出的结果具有一定的不确定性且各种深度学习方法因其结构、损失函数等的不同,导致各模型对极端天气的预报能力存在差异。可能的原因主要有:(1)卷积循环神经网络模型模型在训练时通常选择单一的损失函数作为参数优化的依据,损失函数会最小化模型预测结果和真实图片之间的整体平均误差,而雷达回波数据本身具有稀疏性和不均衡性,导致了模型在预报后期图像出现模糊的现象;(2)天气过程的变化复杂,且雷达回波存在生消等现象,由于现有的卷积循环神经网络模型以雷达回波作为单一数据来源,随着预报时间的延长,预报的不确定性逐渐增加,预报的效果会逐渐降低;针对这些问题,本文提出了两点改进方向:(1)预测图像模糊化问题,后续探索采用生成对抗网络(GAN)等在图像生成领域具有优势的深度学习模型与传统卷积循环神经网络模型相结合,以改善预测图像结果的清晰度问题;(2)预报时长和精度问题,探索多尺度耦合的多源数据融合,如PAN等[31]提出了FURENet模型,将雷达极化数据与雷达回波数据作为模型输入进行预测,提高了模型的预报效果。将雷达回波数据与高分辨率数值模型、大视场的卫星云图等结合,构建多数据源、多尺度耦合的数据驱动深度学习模型也是未来研究的重点。
水利水电技术(中英文)
水利部《水利水电技术(中英文)》杂志是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公开发行。本刊以介绍我国水资源的开发、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术经验为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水环境与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土保持、水库移民、水利现代化、国际水利等。
