在气象大模型快速发展的背景下, 针对其当前无法直接生成闪电预报产品且空间分辨率难以满足精细化预报需求的问题, 北京交通大学耿阳李敖老师团队研究了基于气象大模型的精细化闪电预报方法, 提出大模型与闪电观测双源数据驱动的预报框架, 并设计了面向未来6小时闪电预报的门控时空融合网络(gSTFNet), 以解决双源数据在跨时间和跨模态融合中的挑战.
实验结果表明, 双源融合的预报思路显著提升了直接基于大模型的闪电预报结果, 且优于欧洲中期天气预报中心发布的HRES闪电预报; 与其他基于深度神经网络的预报模型相比, gSTFNet模型取得了更优的性能表现. 相关成果发表于《中国科学: 地球科学》中英文版2025年第9期.
近年来, 基于人工智能的天气预报模型迅速发展, 尤其是气象大模型技术, 预报准确度可与世界领先的数值天气模式相媲美, 而计算开销仅为其万分之一. 然而, 当前气象大模型主要针对基础气象参量, 无法直接预报闪电, 如何将其充分适配闪电预报任务尚无成熟的解决方案. 此外, 气象大模型预报的空间分辨率较粗, 直接使用参数化方法生成闪电预报在精细程度上难以满足现实需求.
北京交通大学、中国气象局以及中国气象科学研究院联合开展了基于气象大模型的精细化闪电预报方法的研究, 提出大模型与临近闪电观测数据双源驱动的预报框架(图1), 旨在融合二者在长期天气趋势预测与短期外推的互补优势提升预报性能. 在方法上, 团队设计了一种门控时空融合网络gSTFNet用于解决双源数据在跨时间和跨模态融合中的挑战. gSTFNet首先使用双源编码器分别对气象大模型预测结果和临近闪电观测数据进行特征编码, 有效减少潜在特征空间中的模态差异; 随后利用门控时空融合模块建模双源特征编码的时空关联, 实现无缝的跨时间融合; 最后通过预测解码器提升融合特征的空间分辨率, 最终生成高精细度闪电预报产品.
图1 预报框架与gSTFNet模型结构图
通过广东地区(20°~26°N、109°~118°E)2018~2022年五年真实闪电观测数据对方法进行评估, gSTFNet模型取得了比欧洲中期天气预报中心发布的HRES预报以及六种基于深度学习的时空序列预测模型更优的性能表现. 这种优势源于模型中的门控时空融合模块, 该模块能够有效地捕捉双源特征的时空关联, 并充分融合双源数据在长期天气趋势预测与短期外推的互补优势, 从而增强了模型的整体预测能力.
为进一步探究不同数据源对gSTFNet模型预报效果的影响, 研究团队对比了仅使用大模型预测数据作为输入(gSTFNet-P)和仅使用闪电观测数据作为输入(gSTFNet-L)的预报结果. 研究结果如图2所示, gSTFNet-P的表现优于HRES, 这表明大模型的预测精度能够与当前领先的NWP方法相媲美; 相比之下, gSTFNet-L在短期预测中表现突出, 尤其在早期阶段明显优于gSTFNet-P, 主要因为其输入的历史闪电观测数据与未来闪电短期发展有较强的相关性, 模型通过训练能够有效捕捉和建模这种关联性. 然而, 随着预报时长的增加, gSTFNet-P的预报精度更加稳定, gSTFNet-L的预报性能则快速衰退, 最终不及gSTFNet-P. 通过有效融合大模型在长期天气趋势预测中的优势以及闪电观测数据在短期预测中的补充作用, gSTFNet在几乎所有时段的表现都优于其他模型, 进一步证明了该融合策略的有效性.
图2 命中率分别为0.3、0.4、0.5水平下gSTFNet变种模型与HRES逐小时评估曲线
综上所述, 虽然现有的大模型尚未能直接生成高精度的闪电预报, 但通过神经网络对其输出进行适配训练, 已展现出一定的预报能力. 然而, 单独依赖气象大模型难以显著提升闪电预报的准确性, 更为有效的策略是将大模型的预测结果与实际观测数据深度融合, 充分挖掘两者的互补优势, 能够实现预报性能的显著提升.