众所周知,达芬奇的一些画作以鸟的视角,展示了意大利的某些区域,其详细程度在当时无与伦比——似乎只有照相机和飞机出现后才有可能。很多人都感到奇怪,他是怎么想象出那些细节的?但现在,研究人员正致力于解决一个“逆向”问题:如果给出一幅地表的卫星图像,那么从地面上看那个地区是什么样子的?这样的人工图像能有多清晰?
现在,加州大学默塞德分校的邓学清(Xueqing Deng,音译)和他的同事为我们提供了答案。他们训练一个机器学习算法,通过分析卫星俯瞰图像,来生成地面视角图像。
这项技术是基于机器智能的一种形式,名为生成式对抗网络,由两个神经网络组成,分别是生成器和判别器。
判别器根据某些习得的标准,比如与长颈鹿有多相像,对生成器生成的图像进行评估。通过使用判别器的输出数据,生成器逐渐学会生成形似长颈鹿的图像。
在研究中,邓学清团队利用地面真实图像和该地区卫星图像来训练判别器。这样一来,判别器就可以学会如何将地面视角图像和俯瞰图像联系起来。
当然,数据集的质量非常重要。研究人员把LCM2015地面覆盖图作为地面真实图像。LCM2015提供了整个英国的土地类别,分辨率为1公里。不过,研究人员把数据限制在71x71公里的网格,包括伦敦和周边地区。对于网格中的每个地点,他们从在线数据库Geograph下载了地面视角图像。
然后,研究人员用1.6万组两两对应的俯瞰图像和地面视角图像来训练判别器。
下一步是开始生成地面视角图像。把4,000幅特定地点的卫星图像输入生成器,利用判别器的反馈,生成每个地点的地面视角图像。研究人员用4,000幅俯瞰图像进行系统测试,与地面真实图像相比较。
结果非常有意思。系统根据俯瞰图像生成的图像贴近实际,只不过质量较低。生成的图像捕捉到了地面的基本特征,比如是否有道路,是农村还是城市等等。“生成的地面视角图像看起来自然,但不出所料,它们缺乏真实图像的那种细节。”邓学清团队说。
这项技术很巧妙,但用处有多大?地理学家的一个重要任务,是根据用途对土地进行分类,比如是农村还是城市。
地面视角图像对此至关重要。然而,现有的地图往往是稀疏的,尤其是农村地区。因此,地理学家不得不在图像之间进行插入补全,这个过程只比瞎猜要好一点。
现在,邓学清团队的生成式对抗网络,提供了一个确定土地用途的全新方法。地理学家如果想知道任何地点的地面视角图像,只需要使用这个神经网络,根据卫星图像来创建地面视角图像。
邓学清团队甚至对插入补全和图像生成进行了比较。结果显示,在确定土地用途时,图像生成技术的准确率为73%,而插入补全方法的准确率只有65%。
这项有趣的技术可以使地理学家的工作变得更加简单。但邓学清团队有更大的野心。他们希望改进图像生成过程,生成更加精细的地面视角图像。达芬奇肯定会对此佩服不已。
翻译:于波
校对:李莉
编辑:漫倩
来源:Technology Review
领取专属 10元无门槛券
私享最新 技术干货