助力数据驱动是否会改变NWP?
主题会议评介
3 会议成果:4个方面最新进展的审视
本次会议的主要目的,除了学术交流之外,还要通过与会专家讨论,针对关键主题,得到会议相对统一的认识。为此,会议最后一天,按照会议主题进行了专题讨论并给出的相关会议结果。
会议开始前,为本次会议设计了总计5个主题:1)地球观测机器学习;2)混合数据同化-机器学习;3)用于模式模拟和模型发现的机器学习;4)面向用户地球科学应用的机器学习;5)机器学习在边缘和高性能计算。
或许因为专注于高性能计算方面的报告不足,会议忽略了主题5。基于会议共识报告得到的4个主题共识(表1),反映了会议的建设性意见和真知灼见。
会上4个主题中,地球观测机器学习涉及领域甚广,从太阳能、野火探测、云探测、降水反演到海洋学/叶绿素探测和测地学,涵盖了地球科学各个学科乃至二级学科。正因为涉及面广,ML对多样性变量和参数观测结果的重复能力及可解释性是一个严重挑战;其次是业务化和社会可用性问题,理论上与物理感知ML的先念物理知识和约束有关,还涉及互用性及与已有的非ML工具的融合。
混合数据同化主题的重要性和价值显而易见,会议强调:1)完全基于AI的分析更新,如利用NN分析更新,并采用对抗性的方法绕过高斯假设;2)混合ML/DA,如模型杂交、将基于物理的模型与统计模型相结合;3)用于预报/订正的AI,包括使用ML对观测值进行预处理,甚至4)应用ML重建过去的气候。诚然,学习全模型对高维系统来说是一个挑战,其中NN不确定性的传播特别具有挑战性,因为涉及非常大的集合预报,处理极端事件需要专门的ML技术。至于混合ML/DA技术,如基于NN的参数化联合估计,面临着与参数估计类似的挑战。ML革命能否横扫传统的NWP是一个极其诱人的课题。
最后一个主题:面向用户地球科学应用的机器学习,是直接研究ML的业务化和具体应用的。首当其冲的应用领域是短临预报降水和极端事件的探测和预报,如热带气旋;再就是气候事件与预测气候风险。此外,更多的应用来自太阳能、能源分配、水圈,环境预测、野火预测和河流流量预测、公共卫生和工业应用、航空飞行计划等丰富领域,凸显AI与数字化碰撞的广泛影响。
与自然语言处理、计算机视觉、自动驾驶、医疗、金融,甚至下棋等智力游戏相比,地球系统科学应用ML/DL技术只能算是后来者。然而,推进ML/DL技术的主要因素,包括大数据积累(图11)、高性能计算能力和更有效及高效的算法,地球科学领域,尤其是气象观测和预报学科,一个都不少。不仅如此,AI技术原始形态中的一些技术,如专家系统等,都最早在气象领域得到应用,这一点,从美国气象学会主持召开人工智能技术主题学术会议已经有20多年的历史,可见一斑。可以说,近现代气象科学本身,从一开始基于观测开展预报并最早借用计算机和算法实现对经验预报的超越,都是在智能技术开发的轨道上取得的,具有深厚的历史。
本次会议,以及之前系列会议的最初两次会议,则是让最新的AI技术更大规模和全领域进入地球系统科学领域的一个窗口,给予我们很多启发。
1)AI成为在NWP和地球系统预报领域打通学界和业界的通用语言。全球NWP领先的ECMWF,不仅是本系列会议的主办方之一,更是目前国际上至少在AI应用于业务方面,依然保持领先。从ECMWF发布的相关战略(图12)看,“押宝”人工智能一直到2030年代,已经成为既定战略。
ECMWF这样的战略选择,主要基于2010年代以来,AI、机器学习和大数据前所未有的发展。进入2020年代,这种发展开始启发许多学科修改其工作范式,更加关注累计的数据并且以数据为中心思考解决方案。这种改变在NWP以及地球系统模拟领域的整个工作流程都提供了巨大的机会,ECMWF已经下定决心,探索人工智能和机器学习的新功能将如何改变地球系统科学的未来。本系列会议以及近年来的进步,都初步显示出AI计算在气象界的巨大潜力。
当然,发展范围和速度也是ECMWF等天气和气候中心需要面对的挑战,特别是在需要建立必要的专业知识、需要开发的软件和硬件基础设施以及集成预测工作流程中的机器学习和传统工具等方面。这些挑战需要在相对较短的时间内得到解决,ECMWF的路线图就明确了挑战和给出潜在的解决方案。
2)EO和DA两个重要领域的捷足先登,会带来气象研究和产业发展的新格局。本次会议,以及之前的两次会议,均围绕地球观测(EO)和数据同化(DA)两个关键领域展开。EO和DA无疑是NWP和地球系统模拟最可能借助AI技术实现突破的领域。本次会议最主要的关注点,即AI技术是否能够完全取代传统动力模式,实现NWP和地球系统预报,虽然从目前材料上看,并没有得到一致意见,但AI技术对预报的“侵蚀”,到本次会议已经更加清晰可见。AI首先创新地球观测和模拟两个维度,将意味气象和大气科学研究和支撑的业务发展范式的重要转向。
3)更多AI开发和应用,培训和借助数字孪生可加速实现。如果说AI在气象界实质性的应用最重要的挑战是什么,目前在职人员较少熟悉AI,更无开发和应用的经历无疑是最难以跨越的。为此,从2019年开始,关于AI技术开发的讲座、培训和研讨,成为ECMWF的业务常态,到2020年与ESA联合召开AI年会,就是为了跨越这道坎,让相关的业务研发人员更多地从AI角度思考和处理问题。不仅如此,ECMWF开发的慕课(图13)面向更多的气象从业者和气象服务对象。
在应用层面,数字孪生技术是最直接将预报模式产品在更深层次上得到应用的重要手段。ECMWF和欧洲多个机构合作,先后举办了相关会议和出台战略(目的地地球等),可期待带着更强的AI标签的模式产品应用的全新模样。
4)卫星云观测或最先受益于AI。如图14所示,卫星云探测中识别云块在地表上的阴影这一看似简单问题,却困扰了很长时间。在爱沙尼亚注册的一家小企业Kappa公司借助AI技术,改进了哨兵卫星云识别码,在北欧获得突破后,即将给出基于AI的全球KappaMask Sentinel-2 云掩码解决方案,大大提升遥感云精度。
举办到第三届的系列会议有几个细节,细想起来有些耐人寻味。一是3次会议会期均为4天,但首次会议每个报告无差别地均为30分钟,第二次会议也仅安排了2场45分钟报告。而本次会议,则划分为45分钟、30分钟和20分钟等3种报告时长类型,给人的感觉是主题所宣示的研发活动,已经从“瞎子摸象”阶段走向更加聚焦。二是该系列最重要的一个特征,就是划分4-5个专题组,会议材料中均给出本专题通过会议得到的进步。例如,从AI技术在不同领域覆盖的分领域来看,仅仅3年时间获得了极大的提升,其增加的态势,大约等于第一次和第二次会议分别有近400人和1100人参会的比例。三是该系列学术会议几乎是专门限定了一个简写词ESOP(地球系统观测和预报)具有持续性的意义:即宣示气象业务开始走向地球系统的视角,又点出该领域或与AI技术联系最重要的两个领域:观测和预报。最后,本次会议首个带有引导性的45分钟主报告,并非如之前两次会议,报告作者来自学界而是来自企业:Sofar海洋科技公司。尽管报告作者有长期在气象部门工作背景,但报告在企业的视角非常突出,尤其是如本报告第一节给出的描述,在凝练和提出气象和地球系统科学研究范式转移的科学问题方面,这样的经历让作者的阐述更具有穿透性,非常难能可贵。
人类社会正在从信息社会进入到智能社会。曾几何时,气象是最早受益于16世纪的传感器发明、18世纪电报通信出现、20世纪电子计算机成功的学科领域,面对智能化时代的来临,气象不会,也不应该长期忽视。在这样的背景下,ECMWF和ESA合作,通过开展系列学术交流,推动气象乃至地球系统科学再次成为智能社会的弄潮儿。