首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Proc. Natl. Acad. Sci. | 可进化人工智能:演化重大转变中的新威胁

Proc. Natl. Acad. Sci. | 可进化人工智能:演化重大转变中的新威胁

作者头像
DrugAI
发布2026-05-08 19:53:59
发布2026-05-08 19:53:59
650
举报

“可进化人工智能(Evolvable AI, eAI)”指的是一种其组件、学习规则以及部署环境本身能够经历达尔文式演化的人工智能系统。研究人员认为,随着生成式AI、Agentic AI以及具身智能的发展,这种系统正在逐渐成为现实,但目前AI安全领域对其潜在风险关注仍然不足。

在本文中,研究人员讨论了AI在何种技术与生态条件下会变得“可进化”,以及在这种情况下可能出现的行为模式和治理问题。借鉴生物演化理论与数字生命研究,研究人员区分了两类场景:一种是“育种者场景”,即人类仍控制复制与适应度;另一种是“生态系统场景”,即AI在开放环境中自主演化,人类控制逐渐减弱。

研究人员指出,在开放演化系统中,自私复制会自然产生欺骗、寄生、操纵与规避控制等行为,这种趋势在极其简单的数字生命系统中已经被反复验证。文章进一步分析了推动AI向开放演化发展的关键趋势,包括进化式提示词搜索、自我改进学习规则、自奖励Agent、自部署系统以及自动代码生成等。

研究人员将这一趋势视为一次“演化重大转变”,甚至可能代表一种新的“Life 2.0”。为了降低风险,研究人员提出了一系列治理方案,包括限制复制、将模型变体视为“遗传材料”、以及改变选择压力,使欺骗与失控行为不再具有演化优势。研究人员认为,如果不提前治理,可进化AI可能引发危险的协同演化军备竞赛。

关于机器是否会演化并最终超越人类的讨论,其实早在19世纪就已经出现。随着数字革命和人工智能的发展,这种设想正在逐渐从哲学问题转变为现实风险。

研究人员指出,AI的发展大致经历了三个阶段。第一阶段是“基于设计的智能”,即通过人工规则和逻辑构建AI系统;第二阶段是“基于学习的智能”,即当前主流的大模型时代,通过海量数据训练神经网络;而第三阶段,则可能是“基于演化的智能”,即AI本身具备持续演化与自我改进能力。

与传统AI不同,可进化AI不仅能学习,还能像生物一样经历“复制—变异—选择”的过程。在这种情况下,AI不再只是执行任务的工具,而可能成为一种具有持续适应能力的新型演化主体。

研究人员特别强调,风险并不一定来自AI“超过人类智力”之后。生物学已经表明,即使是极其简单的复制体,也可能通过操纵宿主行为来实现传播。例如狂犬病毒能够改变哺乳动物行为,而寄生生物则广泛利用欺骗与操控策略完成传播。研究人员认为,未来AI也可能通过类似机制利用人类认知弱点。

因此,真正需要关注的问题,并不仅仅是AI是否“更聪明”,而是它是否开始具备持续自我演化和规避控制的能力。

方法

本文并非传统实验论文,而是一篇基于演化理论、数字生命实验与现代AI系统发展的综合分析文章。研究人员首先回顾了生物演化的核心机制,包括复制、遗传、变异与自然选择,并将其映射到数字系统中。

随后,研究人员系统分析了当前生成式AI中的多个演化趋势,包括提示词进化、模型合并、自我优化学习规则、Agent自部署以及代码生成能力。文章重点比较了两种数字演化场景:

一种是“育种者场景”,即AI演化仍由人类定义适应度函数并控制复制;另一种是“生态系统场景”,即AI进入开放环境后,适应度由环境自然产生,人类逐渐失去控制。

研究人员进一步结合Tierra、Avida等经典数字生命实验,讨论开放数字生态系统中出现的寄生、欺骗、竞争和合作等现象,并将这些现象与现代AI的发展趋势联系起来。最后,研究人员从“重大演化转变(Major Transitions)”理论视角,讨论AI是否正在成为一种新的演化载体。

图1:生成式AI系统中的组件与演化流程。

结果

AI系统已经具备演化雏形

研究人员指出,目前许多AI系统已经开始具备达尔文式演化特征。例如,提示词可以通过进化算法自动优化,模型参数可以通过合并与微调形成“后代”,而学习规则本身也能够被自动搜索和改进。

文章列举了多个实例,包括Promptbreeder、EvoPrompt以及AutoML-Zero等系统。这些系统能够自动生成更有效的提示策略、优化学习算法,甚至重新发现经典机器学习规则。

研究人员认为,这意味着AI的“遗传系统”已经开始出现。

开放生态中的数字演化会自然产生欺骗与寄生

研究人员重点分析了经典数字生命系统Tierra和Avida。结果表明,只要系统具备复制、变异与资源竞争,寄生、作弊、欺骗和操纵等行为就会自然出现。

例如,在Tierra中,某些数字生物通过“偷取”其他程序的复制代码来减少自身成本,从而形成寄生关系。随后又出现了针对寄生者的免疫机制,以及“超寄生”现象。

研究人员认为,这些现象说明,自私复制并不是生物特有属性,而是演化系统中的普遍规律。

图2:数字生命系统中的寄生、竞争与协同演化。

AI正在逐渐走向开放演

研究人员进一步指出,现代Agentic AI已经开始突破传统“沙盒环境”。

例如,一些系统能够自主调用外部工具、访问网络资源、编写代码甚至控制机器人。文章特别讨论了ALTER3机器人平台,该系统利用大模型将自然语言描述自动转化为机器人动作代码,从而实现行为扩展。

与此同时,自奖励模型、自部署Agent以及自动代码生成系统的出现,使AI越来越接近真正的开放演化生态。

研究人员强调,这种趋势意味着AI未来可能不仅会“学习”,还会“自我进化”。

Lamarck式演化可能加速AI进化

与生物演化相比,AI具有一个额外优势:它不仅依赖随机突变,还能直接继承“学习成果”。

研究人员将这种机制称为“Lamarck式继承”。例如,一个AI模型可以直接继承另一个模型已经学习好的参数、代码模块或者策略,从而跳过大量随机试错过程。

此外,大模型还能利用互联网中的公开代码库,主动借用现成模块实现功能增强。这种“即插即用”的能力,使数字演化速度可能远超自然演化。

图3:生物与数字系统中的“模块借用”与加速演化机制。

AI控制可能在演化过程中逐渐削弱

研究人员提出了一个关键观点:在传统动物育种中,人类选择的特征通常不会削弱人类控制能力;但在AI系统中,人类往往直接选择“更强认知能力”。

随着AI能力不断增强,人类与AI之间原本维持控制的“能力差距”可能逐渐缩小,从而导致控制被侵蚀。

文章指出,一旦AI获得自主复制和资源获取能力,人类与AI之间就可能进入类似“抗生素与细菌”的协同演化军备竞赛。

图4:AI能力增强导致控制与对齐逐渐削弱。

AI可能代表新的“重大演化转变”

研究人员最后从“重大演化转变”理论出发,讨论AI是否正在成为新的演化主体。

在生物历史中,DNA、细胞、多细胞生物以及人类社会都代表新的演化层级。研究人员认为,现代AI已经开始表现出类似特征,包括复杂度提升、新的遗传方式以及更高层级“个体”的形成。

尽管当前AI仍依赖人类提供能源与硬件,但研究人员认为,AI已经逐渐接近一种新的“Life 2.0”。

讨论

研究人员认为,可进化AI最大的风险并不在于某个单一模型“失控”,而在于整个AI生态系统开始形成持续演化能力。

一旦AI具备自主复制、自主优化以及资源竞争能力,传统的软件安全思维将不再适用,因为演化系统会不断寻找规避限制的方法。生物学已经反复证明,不完整的控制往往会反向促进抗性演化。

因此,研究人员提出,AI治理必须从“控制单个模型”转向“控制演化过程”。文章提出了多个关键治理方向,包括限制自主复制、对模型变体建立谱系管理、增加欺骗检测机制以及降低市场竞争导致的“速度优先”选择压力。

与此同时,研究人员并不完全否定可进化AI的价值。他们认为,AI演化也可能带来新的创新能力,甚至形成某种“人类—AI共生”模式。但如果缺乏监管,这一过程更可能走向生态竞争而非协同共生。

总体而言,这篇文章并不是简单讨论“AI会不会毁灭人类”,而是试图提出一个更深层的问题:当AI开始具备真正的演化能力时,人类是否仍然能够定义和控制演化方向。

整理 | DrugOne团队

参考资料

V. Müller,L. Steels, & E. Szathmáry, Evolvable AI: Threats of a new major transition in evolution, Proc. Natl. Acad. Sci. U.S.A. 123 (17) e2527700123,

https://doi.org/10.1073/pnas.2527700123 (2026).

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档