人工智能现在可以从各个角度看待事物。 Google的姊妹公司DeepMind开发了一个神经网络,该网络根据单个图像从其他角度自学了一个“想象”的场景。
给定一个场景的二维图片——比如说,一个有着砖墙的房间,一个明亮的球体和地上的立方体——神经网络可以从不同的有利位置生成3D视图。要做到这一点,它会渲染隐藏的对象,并以相同的光源更改阴影落下的地方。
被称为生成查询网络(Generative Query Network)的系统可以从基本图像中提取细节以猜测空间关系,包括相机的位置。
为了训练神经网络,DeepMind的Ali Eslami和他的团队从不同的角度展示了一幅场景的图像。它用这些来预测从背后或从旁边看什么样的东西。该系统还教授自己关于纹理,颜色和照明。相比之下,目前的监督式学习技术需要手动输入AI来标记场景的细节。新系统还可以控制虚拟物体,将其空间关系知识应用于移动机器人的手臂以拾取球的场景。
从事DeepMind项目的Danilo Rezende表示,即使我们没有意识到这些,它也会像我们一样学习很多东西。人工智能在拍摄了几张照片之后就可以从不同的角度使用这种能力来确定一个迷宫的布局。
Science,doi.org/gdm9hz
领取专属 10元无门槛券
私享最新 技术干货