

次季节至季节(Subseasonal-to-Seasonal, S2S)预测始终是大气科学和地球系统科学领域的"预测沙漠"。这一时间窗口(约2周至3个月)处于传统数值天气预报(NWP)模式的可预报性极限之外,又短于气候预测的季节至年际尺度。NWP模式在中期预报(1-14天)后因混沌增长导致误差饱和,而低频气候信号尚未充分建立。这种"双重困境"使得S2S预测成为全球防灾减灾的重大科学瓶颈。
对于野火预测而言,S2S时距具有不可替代的实践价值。消防资源调度、燃料管理方案制定、应急人员配置等关键决策均需提前数周至数月进行。传统的火险天气预报系统(如欧洲森林火灾信息系统的FWI指数)在超出10-14天后预测技巧急剧下降,基本丧失业务指导能力。现有S2S系统多依赖于温度和降水异常的统计关系,但这类方法无法直接转化为 burned area 等具有明确物理意义的业务变量。这种"科学-业务"脱节严重制约了科研成果的社会经济效益转化。
本研究直面S2S野火预测的核心科学问题:如何有效提取和利用地球系统慢变成分(如土壤湿度记忆、海表温度异常、大气遥相关型)中的可预报性? 这是典型的多尺度、非线性、非局地耦合问题,传统统计诊断方法和动力降尺度方案均难以满足需求。
气候遥相关(Teleconnection)作为大气科学经典概念,指大尺度气候系统通过行星波、海气耦合等过程在不同地理区域间建立的动力联系。近年来大量观测证据表明,全球野火活动并非孤立事件,而是受到ENSO、NAO、AO、PDO等主导气候模态的显著调制。Cardil等(2023)的定量研究表明,气候遥相关可解释全球52.9%的 burned area 变率。这种调制作用具有显著的时滞特征和区域差异性——西伯利亚极端野火与前冬北极涛动(AO)相位及前期土壤湿度异常相关;非洲萨瓦纳火活动与ENSO及印度洋海温异常存在2-6个月的滞后关系。
从物理机制看,遥相关通过三条路径影响野火:1)大气环流调控:遥相关型改变大尺度天气型频率,影响降水、温度、相对湿度等局地火险气象条件;2)前期土壤-植被记忆:前期降水异常通过土壤湿度记忆效应持续影响植被含水率,这是S2S尺度的关键可预报性来源;3) 人类活动调制 :气候异常通过农业、畜牧业等社会经济活动间接改变火源分布和燃料结构。这三条路径构成典型的"全球强迫-区域响应-局地反馈"级联过程,传统统计方法难以同时捕捉其时空异质性和多尺度非线性特征。
深度学习(DL)为S2S预测提供了全新范式。与物理模式不同,DL通过数据驱动方式直接从历史样本中学习复杂非线性映射,规避了显式参数化物理过程的困难。WeatherBench 2.0等基准测试证实,DL模型在中期天气预报中已超越传统NWP模式。Fuxi-S2S、GenCast等模型进一步将技巧延伸至S2S尺度,其核心创新在于:1)利用历史再分析数据捕捉慢变海洋-大气信号;2)通过隐式动力学习低频模态演化;3)采用集成预报技术量化不确定性。
然而,野火预测具有特殊挑战:强类别不平衡(burned area 占比<1%)、多源异构数据融合(气象、植被、社会经济数据)、空间异质性(不同生物群落火机制迥异)、时间多尺度性(从日变化到季节循环)。现有DL野火研究多集中于短临预报(1-5天),S2S尺度研究尚处起步阶段。Michail等(2025)的FireCastNet采用图神经网络建模空间依赖,但未显式引入遥相关指数;AttentionFire等循环神经网络架构对长时间记忆捕捉能力有限。本研究的突破点在于:将大气科学先验知识(遥相关指数)以结构化方式嵌入DL架构,实现物理引导的深度学习(Physics-Guided DL)。
TeleViT的核心创新在于其不对称Tokenization策略,这解决了多尺度异构数据融合的长期难题。传统Vision Transformer(ViT)采用均匀网格划分,无法处理空间分辨率、通道维度和时间维度差异巨大的输入。TeleViT对三类输入实施差异化处理:
每个token通过独立的线性投影映射到统一嵌入维度D=768,叠加可学习位置编码后输入Transformer编码器。这种设计的技术精妙在于:既保持了各类输入的固有结构特性,又在隐空间实现统一表征,使自注意力机制能在异构token间建立跨尺度、跨模态的依赖关系。相比之下,传统方法需通过繁琐的预处理(如插值、降维)将多源数据对齐,往往导致信息损失。
标准Transformer编码器在token化序列上执行自注意力计算,产生N×N的注意力权重矩阵(N=25+72+100=197)。关键突破在于注意力矩阵的块结构:
注意力卷积(Attention Rollout)技术通过累积多层注意力流,揭示跨层级的信息传导路径。这种设计使模型能自动学习空间分层注意力:底层注意力头聚焦局地特征交互,高层头捕捉全球-局地远程连接。这与大气科学中"级联效应"(Cascade Effect)的物理图像高度一致。
早期TeleViT版本采用分类token和大解码器,导致空间结构崩塌。本研究的关键改进是逐token解码器:每个局地token独立解码为其对应空间patch的预测,再通过空间拼接重构完整burned area图。该设计确保:
这种"编码器-注意力-局地解码"范式与U-Net的跳跃连接有本质区别:U-Net通过通道拼接传递低级特征,而TeleViT通过注意力机制实现动态的、依赖输入的跨尺度信息路由,更具灵活性。
SeasFire v0.4数据集是本研究的基石,其科学价值在于:首次将多圈层火险驱动因子统一到时空一致的Cube结构。数据集覆盖2001-2021年,8天时间分辨率,0.25°空间分辨率,包含:
数据预处理的关键科学性体现在:人口密度和降水的对数变换既压缩了长尾分布,又保留了零值,这对野火这种稀疏事件至关重要;标准化处理(Z-score)消除不同物理量纲,使注意力机制能公平比较各变量重要性;时间序列构造采用10个月历史指数,覆盖ENSO演变周期(约6-18个月),确保模型可捕捉季节锁相特征。
训练-验证-测试集按年份划分(2003-2017训练,2018验证,2019测试),这种时间外验证(Out-of-Time Validation)避免了严重的数据泄露问题。排除2001-2002年数据是因MODIS Aqua卫星发射后burned area观测精度显著提升,体现了对数据同源性的严格把控。
超参数搜索揭示重要规律:小模型偏好性。最佳配置为8层、8头、MLP维度1536,远小于标准ViT-Base(12层、12头、3072)。这表明S2S野火预测任务的数据复杂度有限,深层网络易过拟合。Token尺寸优化显示:
这些优化结果体现了 "奥卡姆剃刀"原则在DL中的适用性 :任务复杂度决定模型复杂度,盲目增大模型并非良策。
TeleViTi,g在16周(128天)预报时效达到AUPRC 0.6016,较ViT(0.5824)提升3.3%,较气候学基准(0.5716)提升5.2%。AUPRC(Area Under Precision-Recall Curve)的选择具有科学深意:野火预测是极度不平衡的二分类问题(burned area占比<1%),传统AUC-ROC会因大量易分类的非火点而虚高。AUPRC聚焦正类(火点)的精确率和召回率,更能反映模型对真实火险的捕捉能力。
性能衰减曲线显示,TeleViTg(仅全球场)和TeleViTi,g的衰减斜率显著缓于ViT。这表明全球场提供的慢变信号在长时效预测中价值凸显。值得注意的是,TeleViTi(仅遥相关指数)性能接近ViT,说明单纯加入指数并未带来质的提升,反而增加计算开销。这暗示:遥相关指数的信息熵可能已被全球场(如SST、海平面气压)隐式包含,显式指数引入更多是物理先验的"软化约束"。
GFED区域分析揭示模型性能与火机制的深层联系:
这些差异深刻表明:DL模型的可预报性上限由目标系统的内禀确定性决定。对于强强迫-强响应系统(如非洲萨瓦纳),DL可逼近理论上限;对于弱强迫-随机扰动主导系统(如北方森林),任何数据驱动方法均面临根本性局限。
图3的预测分布直方图揭示关键现象:长时效预测(h=16)的softmax分数分布更集中低值区,短时效(h=0)更分散。这并非性能下降,而是预测不确定性的合理表达。在S2S尺度,火活动固有不确定性增大,模型应表达更低的确信度。目前TeleViT输出的是类别概率(确定性预测),未来应拓展至深度集成(Deep Ensemble)或扩散概率模型(如GenCast),显式量化预报不确定性。这符合贝叶斯概率预测框架:P(火|气候) = ∫P(火|气候,参数)P(参数|数据)d参数。
注意力权重统计显示(图5):局地token平均注意力权重≈0.012,全球token≈0.005,指数token≈0.004。标准差分析极具启发性:局地token注意力标准差极高(尤其在亚马逊、非洲),表明模型在不同空间位置选择性激活特定局地驱动因子;全球token标准差低,说明其提供全局一致的季节性背景场;指数token注意力最低且稳定,暗示其作为辅助约束而非主驱动。
图6的空间注意力图显示,局地-局地注意力与预测火区高度重合,证实"局地信息主导"假设。局地-全球注意力虽弱,但在非洲东南部显示对印度洋SST patch的微弱关注,可能隐含ENSO遥相关信号。然而,作者谨慎指出:低注意力值不能直接解释为因果关联,可能是注意力机制的过度参数化导致的微弱随机耦合。这涉及DL可解释性的根本困境:注意力权重反映相关性而非因果性,需结合物理先验排除伪相关。
集成梯度(Integrated Gradients)结果(图7)揭示驱动因子的时效依赖性:
值得注意的是,传统火险指数(FWI)未出现在输入变量中。作者依赖原始气象场让模型自学习火险状态,这虽增加自由度,但也导致可解释性下降。未来应探索物理信息嵌入,如将FWI作为显式特征输入,约束模型学习物理一致的特征表示。
核心发现是:显式遥相关指数未显著提升技巧。这引发深刻反思——是否意味着传统气候诊断的指数在DL框架下冗余?可能原因是:
但完全放弃物理指数存在风险:DL可能过拟合到数据噪声,学习虚假遥相关(如ENSO与中东火活动的伪相关)。Bommer等(2025)尝试将NAO指数转化为分类变量(正/负/中性),利用物理阈值约束注意力。更优策略是 因果结构注入 :基于已知物理机制(如ENSO→降水→土壤湿度→火险)构建因果图,在注意力计算中屏蔽非法路径,实现物理引导的注意力稀疏化。
当前TeleViT输出确定性概率,但S2S预测本质上是概率性问题。火险概率分布比单点预测更具决策价值。两条技术路径:
TeleViT架构具有普适性,适用于任何具有"局地-全球"分层结构的地球系统变量预测:
核心挑战是目标变量稀疏性与观测质量。burned area观测存在显著不确定性,MODIS火烧迹地产品在小面积火、云层覆盖区误差较大。未来需融合多源观测(VIIRS、Sentinel-2),构建不确定性加权损失函数,使模型学习对观测误差的鲁棒性。
本研究由希腊与西班牙的联合团队完成,核心作者包括:
单位分工明确:雅典国立技术大学负责核心算法与数据处理,瓦伦西亚大学提供DL理论支持,Harokopio大学贡献地球系统科学解释。研究受欧洲空间局(ESA)Future EO-1 "SeasFire"项目资助,体现了欧洲在地球观测AI应用领域的协同创新。
这种"数据-代码-交互工具"三位一体的开放科学实践,符合Nature/Science级期刊的reproducibility标准,值得国内研究借鉴。






以上是对文章的详细解读,如有不当之处欢迎批评指出!也可以私信小编。
END
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。