首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >《Nature》最新!“革命性”AI工具拯救古老天气数据,助力气候模型升级

《Nature》最新!“革命性”AI工具拯救古老天气数据,助力气候模型升级

作者头像
气象学家
发布2026-03-25 19:14:23
发布2026-03-25 19:14:23
20
举报
文章被收录于专栏:气象学家气象学家

《Nature》最新!“革命性”AI工具拯救古老天气数据,助力气候模型升级

专业的机器学习模型正帮助研究人员转录数百年前的手写记录。

https://www.nature.com/articles/d41586-025-02798-y
https://www.nature.com/articles/d41586-025-02798-y

https://www.nature.com/articles/d41586-025-02798-y

刚果民主共和国气象档案馆里数千份纸质文件正在被数字化。来源:Derrick Muheki/INERA DRC
刚果民主共和国气象档案馆里数千份纸质文件正在被数字化。来源:Derrick Muheki/INERA DRC

刚果民主共和国气象档案馆里数千份纸质文件正在被数字化。来源:Derrick Muheki/INERA DRC

各国如何才能知道气候变化将在区域尺度上如何影响自己?人工智能(AI)能否帮助预报飓风和其他极端天气事件?世界是否已经突破了《巴黎协定》最具雄心的目标——将全球升温控制在比工业化前水平高1.5°C以内?

回答这些问题的迫切需求,正促使研究人员挖掘遍布全球、横跨两百多年却尚未利用的手写天气记录宝库。这些珍贵——却部分难以辨认——的数据,借助更先进的新机器学习工具,正变得触手可及。

荷兰皇家气象研究所(KNMI)气候科学家Marlies van der Schee说:“世界各地的气象部门都有地下室,里面堆放着19世纪以来从未数字化的资料。许多机构甚至不知道自家档案馆里到底有什么。”

寻找数据

在搜集缺失气候数据的征途上,气候科学家Derrick Muheki走得比大多数人都远。为了查阅刚果民主共和国(DRC)气象档案——涵盖1960年独立时全国37个气象站的记录——Muheki先从金沙萨飞到北部基桑加尼,再沿刚果河乘船,最后骑摩托车走土路,抵达DRC国家农艺研究所(INERA)的Yangambi分部。今年初,他在那里花了两个月,扫描了数千页天气日志。

由于INERA这个偏远分所没有接入国家电网,Muheki得带足电池,供数码相机全程使用。他自学了班图语林加拉语,以便与INERA同事沟通。他说,很多词汇与他家乡乌干达的语言相似,帮了大忙。

十八世纪英国船只HMS Dolphin的航海日志等旧船记录,也能为气候模型提供数据。来源:The History Collection/Alamy
十八世纪英国船只HMS Dolphin的航海日志等旧船记录,也能为气候模型提供数据。来源:The History Collection/Alamy

十八世纪英国船只HMS Dolphin的航海日志等旧船记录,也能为气候模型提供数据。来源:The History Collection/Alamy

回到布鲁塞尔自由大学(VUB)研究组后,Muheki用自己设计的机器学习工具MeteoSaver1,从9000多张扫描图像中提取数据。初步测试时,MeteoSaver的转录准确率仅75%,但通过对开源手写识别包Tesseract的进一步训练和算法优化,已提升至90%。

这些数据将为世界第二大雨林的气候变化提供关键信息。Muheki的导师、VUB气候科学家Wim Thiery指出,由于非洲森林心脏地带过去温度资料匮乏,政府间气候变化专门委员会(IPCC)2021年报告在评估全球变暖的区域严重程度时,这里成了显著的数据空白。他希望Muheki等人的努力能填补这一空白。

被遗忘的数字

Muheki遭遇的物流难题虽罕见,但远非DRC一国尚未完全数字化天气记录。

英国雷丁大学气候科学家Ed Hawkins说:“世界各地档案馆里仍有大量纸质记录在沉睡。”英国国家气象档案馆就有数百万条未被利用的降雨观测。

Hawkins曾主持多个依靠公民科学家手动转录气候记录的项目。他说,大约十年前,机器学习工具还无法胜任。对AI来说,最难的不是识手写文字,而是辨认表格结构。“当年我和同事试用AI工具,它们根本处理不了表格数字,因为训练数据里没有。”Muheki的大量工作正是开发专门算法解决此问题。Hawkins表示,如今工具终于接近人类水平,他也是介绍MeteoSaver论文的合著者。

其他团队的类似努力显示,机器学习可大幅加快历史记录抢救速度。“这真是一场数据拯救能力的革命。”Thiery说。

哥本哈根丹麦气象研究所气候科学家Martin Stendel说,他们正在开发定制的机器学习系统,转录19世纪丹麦船只的数千本航海日志,以填补大西洋和北海气候系统历史记录的关键空白。

细节决定成败

自气候建模诞生以来,数据抢救工作一直低调进行,Hawkins说,但其重要性正日益凸显。

随着“数据饥渴”的机器学习气候预报模型出现,原始数据愈发珍贵。转录技术提升后,研究人员不仅能数字化新文档,还能重新审阅已看过的资料。人工转录时,往往只提取月平均气温,而忽略小时数据或风向、云量等定性信息。“借助机器学习,我们希望这些信息也能被利用。”伯尔尼大学气候科学家Stefan Brönnimann说。

气候科学家德里克·穆赫基在扬安比拍摄了历史记录,然后建立了一个机器学习工具来解读这些记录并提取有用的数据。图片来源:德里克·穆赫基/INERA DRC
气候科学家德里克·穆赫基在扬安比拍摄了历史记录,然后建立了一个机器学习工具来解读这些记录并提取有用的数据。图片来源:德里克·穆赫基/INERA DRC

气候科学家德里克·穆赫基在扬安比拍摄了历史记录,然后建立了一个机器学习工具来解读这些记录并提取有用的数据。图片来源:德里克·穆赫基/INERA DRC

更精细的数据将满足对短期天气变率、长期趋势以及罕见破坏性事件日益增长的理解与预测需求。例如,历史飓风和特大洪水的频率、强度信息,对研究人员将现代事件与气候变化联系起来至关重要。

气候科学家的一大疑问是,全球平均气温是否已比工业化前水平升高1.5°C——《巴黎协定》设定的力争目标。科学家通常以1850年为前工业基准,因为可靠记录自此开始。但在计算175年前的“正常”气温时,误差条仍很大。研究人员正着手把数字记录推回18世纪晚期。“知道我们如今所处位置的最大不确定性,就在过去。”Hawkins说。无论是数百年前的旧文档,还是最新的AI技术,都将在寻找答案的征程中发挥关键作用。

END

声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 气象学家 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 《Nature》最新!“革命性”AI工具拯救古老天气数据,助力气候模型升级
    • 寻找数据
    • 被遗忘的数字
    • 细节决定成败
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档