近日,DeepMind 的研究者提出了一种人工生命框架,旨在促进智能生物体的出现。该框架中没有明确的智能体概念,而是由原子元素构成的环境。这些元素包含神经操作,通过信息交换和环境中包含的类物理规则进行交互。研究者讨论了进化过程如何导致由许多此类原子元素构成的不同生物体的出现,这些原子元素可以在环境中共存和繁荣。此外,研究者还探讨了这如何构成通用 AI 生成算法的基础,并提供了这种系统的简化版实现,讨论了需要做哪些改进才能进一步扩大规模。
论文地址: https:// arxiv.org/pdf/2101.0762 7.pdf
DeepMind 提出新系统
现实世界是由相互作用并组成更大实体的基本粒子构成的。DeepMind 研究提出的环境(AI 生成算法)是由元素构成的,但尺度较大。每个元素包含一个神经操作,比如矩阵乘法、外积,或者是包含这些算子的序列。这些元素通过某种形式的基本规则——一种物理类型,以及神经状态的直接通信进行彼此交互。
该系统有多种实现。这篇论文提供了网格世界(grid-world)实现,其中的基本元素位于网格上,通过传播信号或注意力机制进行通信,并与实现能量和类化学交换的底层物理进行通信。另一个例子是在三维空间中形成刚性零件的元素,这些零件可以通过连接点(joint)进行连接,连接点包含神经操作,通过与附近连接的零件交换信号来进行交互,并在连接点上设置扭矩。系统中可能存在多种类型的元素,并非所有元素内部都需要有神经网络。
研究者在论文中提供了一种网格实现,突出显示了许多重要属性,并探讨了要让该系统变得强大需要进行哪些改进。
但是,该系统的潜力是无限的,它支持如下功能:
由多个元素组成的较大单元可以通过物理连接(如机器人)来形成,也可以简单地作为一组决定进行通信并形成整体的单元。这些单元的潜在大小没有限制。它们可以通过多种方式传播——通过接管环境中的其他元素来生长(殖民地),也可以通过组装新的副本进行复制,将适当的收集元素移动位置(例如机器人通过组装碎片来复制自己)或自我组装,或者它们可以生成完全不同的单元,这些单元可以实现专用的功能(一种有用的机器),或者比其前代产品更好的单元。而后者可能需要智能(intelligence)。
智能的能力
为什么说该研究提出的计算系统具有表示通用智能的能力,研究者提供了两个论点:
首先,机器学习中已有的任何神经算法,或者未来可能创建的算法,都可以写作一串操作序列,例如加法、矩阵乘法、外积和非线性运算,并在张量状态下进行操作,例如由神经网络的前向、后向和优化器操作产生的序列。AutoML-Zero 意识到了这一点,它直接搜索此类算子的序列以及与其所运行状态的连通性,并且能够学习基本的神经算法。由于这些算子是环境的基本构建元素,且能与任意连通性进行通信,因此所有的神经算法都可以在该系统中实现。
智能体假设
在该系统中,没有智能体和环境之分,只有环境。元素本身可能形成也可能不形成进化单元,进化单元的繁殖会显示出遗传性但遗传的区域并不确切。在前一种情况下,它们可以自主移动,收集能量并进行复制,形成更大的聚集体或复制生物体,因为这样做具有优势。而该研究则是针对后者,它需要最小数量的更简单协作单元进行自我传播。
SIM 的网格版本和通用属性
该论文还介绍了自组织智能物质(self-organizing intelligent matter,SIM)的实例,讨论了其各个方面,并提供了该研究认为它能够构成 AI 生成算法的更多原因。
如上文所述,这里没有内置的智能体概念,实际上只有一个环境。通常情况下,在两个不同平台上实现该系统是很不自然的:一个用于物理部分,例如物理模拟器;一个用于神经部分,如 TensorFlow、PyTorch 或 Jax 等神经网络框架。该研究建议在单个平台上制作这样的系统。要产生智能行为,需要高效地运行神经网络,因此该系统需要在后一种平台上实现。出于灵活性的考虑,该研究选择了 Jax。
Jax 在张量上运行,该研究用张量来存储元素。这些元素需要交互,并具有形成任意大小灵活聚合体的能力。
实验
该研究运行了上述系统,在一系列运行之间观察到了令人兴奋的多样性,如图 2 所示。
图 2:运行结果。上面一行中,研究者用不同颜色代表 3 种不同的随机权重。
如图 2 上面一行中我们可以看到,在多个区域中,两种元素都能够稳定共存,即相同空间区域中存在不同颜色的点。并且这能持续很长时间,说明它们发现了一种共存的方式。
领取专属 10元无门槛券
私享最新 技术干货