前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >印度小哥在「我的世界」里搭神经网络,做图像识别,网友:这是「别人的世界」

印度小哥在「我的世界」里搭神经网络,做图像识别,网友:这是「别人的世界」

作者头像
机器之心
发布2020-05-19 10:48:27
4540
发布2020-05-19 10:48:27
举报
文章被收录于专栏:机器之心

机器之心报道

参与:泽南、小舟

在沙盒游戏《我的世界》中,有人搭建了完整的校园,有人举办了毕业典礼,有的人从零开始制作计算机,玩家们层出不穷的创意总能让人眼前一亮。现在,又有一位印度程序员展现了真正的技术:在《我的世界》里搭建神经网络。

对于计算机科学爱好者们来说,有关《我的世界》中的环境是否「够格」作为各种严肃实验的话题,早已经过了充分讨论:

答案是肯定的,《我的世界》中红石电路和命令方块体系已经分别图灵完备了。这意味着我们理论上可以在其中构建一个通用图灵机(虽然难度比较大),进而造出一台功能完整的常规架构计算机。

既然如此,我们能不能在游戏里「敲出」一个神经网络模型呢?

已经有人做到了。最近,一名来自印度的程序员 Ashutosh Sathe 向我们展示了真正的技术,他在《我的世界》里运行起了一个具有图像识别能力的神经网络。

只要在游戏里的「画板」上写字,《我的世界》里的「计算机」就可以识别出你写的内容是什么:

在《我的世界》里进行 MNIST 式的手写数字识别。

「神经网络推断出画板上的文字为数字 1」。

除了给出识别的结果,神经网络识别的过程也是清晰可见:

在看了这波操作之后,众多吃瓜网友留下了不争气的泪水,感慨道:「这是『别人的世界』……」

这一炫酷的技术被称为 scarpet-nn,是一套可以让玩家在《我的世界》游戏中运行二值神经网络(BNN)的工具。BNN 是一种激活、权重被固定为 1 或-1 的特殊神经网络,大幅度简化了神经网络的运算量,最早由 Yoshua Bengio 等人提出。正是这些特性,让 BNN 的权重可以由单个二进制位来表示,并在《我的世界》里运行。

与此前人们在《我的世界》中运行神经网络的一些尝试不同,scarpet-nn 的 API 允许人们在游戏中运行任何二值神经网络的体系架构。也就是说,任何人都可以训练自己的二值神经网络,然后将其运行在《我的世界》里。

先看一下完整的 Demo 视频:

此外,Ashutosh Sathe 还开放了代码。

项目地址:https://github.com/ashutoshbsathe/scarpet-nn

技术细节:投影(Litematica)原理图生成

要想在我的世界里运行神经网络,你首先需要安装一个 Java 版游戏,Litematica 和 carpetmod 两个 mod,另一方面还需要有 Python 3,深度学习框架 pytorch 和 nbtlib 库。

通用表征标准

在 scarpet-nn 中,nn-to-litematica 模块将 pytorch 检查点的二值化权重转换为 litematica 原理图。每个 litematica 的排列方式是让前两个维度位于 (x,z) 平面上。此外,原理图的加载点(加载原理图时玩家所在的区域)总是表示权重数组中的第一个数字。权重数组中的第一个维度是从加载点到 X 轴正半轴,第二个维度是从加载点到 Z 轴正半轴。超过 3 的维度会被重塑成第 3 个轴(Y 轴)。

卷积层的表征

这里遵循上述通用表征标准。由于卷积层是以四维数组的形式存储的,因此需要压缩额外的维度,使其变成三维。卷积层的典型 shape 是 [c_2,c_1,f_h,f_w]。其中,

  • c_2 = 输出激活应有的通道数
  • c_1= 输入激活应有的通道数
  • (f_h,f_w)= 卷积滤波器的高度和宽度

为了将此转换成三维的表征,scarpet-nn 将 (f_h,f_w) 压缩成一个大小为 f_h×f_w 的单一维度。因此,生成的原理图中新的卷积层将会是 [c_2,c_1,f_h×f_w]。

为了直观地理解这一点,请看下面的样例图片。该图展示了第三个卷积层(conv3)权重的块表征,它的权重从 [16, 8, 3, 3] 压缩成了 [16, 8, 9]。

全连接层的表征

全连接(fc)层也符合 scarpet-nn 的通用表征标准。全连接层的典型 shape 是 [n,k],输入是 [m,n],输出是 [m,k]。由于所有的操作都是二维的,所以不需要做维度调整。由于也没有第三维,所以整个的权重数组都在 X-Z 平面内。

如下是 fc1 层的示意图。该层的 shape 是 [8, 16]。

看完技术细节,有人觉得,在这种像素化的沙盒游戏里,用红石搭建神经网络,未免也太过复杂……

但也有人觉得,恰恰是因为用红石逻辑构建网络,才让人印象深刻。

作者本人回复说,scarpet-nn 比命令方块体系的性能要好得多,《我的世界》可以将其用于绘制地图时在隐蔽模式下打开隐藏内容。

只是目前,在《我的世界》中可以实现的神经网络功能仍然有限:看起来只有前向传播而没有反向传播。

不过在玩家们的不懈努力下,又有什么是不能实现的呢?

参考链接:

https://ashutoshbsathe.github.io/scarpet-nn/

https://www.reddit.com/r/MachineLearning/comments/gb08da/p_i_wrote_an_api_to_build_neural_networks_in/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档