

大家好,我是人月聊IT。今天继续聊AI和人工智能方面的话题。即对于AI的下一个发展的关键突破点究竟是什么?
我个人理解仍然还是在具身智能上面。所以要回答这个问题,我们还是需要先再看看对于具身智能的详细定义。
具身智能指智能体通过身体与环境的动态耦合(Dynamic Coupling)产生适应性行为的能力。其智能表现(如决策、学习、推理)并非仅由大脑或中央处理器控制,而是** distributed across the brain-body-environment system**(分布于大脑-身体-环境系统)。
例如,人类行走时无需精确计算每一步的力学参数,而是通过身体与地面的自然交互(如肌肉弹性、重力反馈)实现稳定步态。

表格具身智能和传统AI的关键区别如下:
维度 | 传统AI(离身认知) | 具身智能 |
|---|---|---|
认知载体 | 符号计算(如逻辑规则、神经网络) | 身体-环境交互(如传感器-运动器循环) |
知识来源 | 预编程或数据训练(如大数据集) | 实时感知-行动循环(如试错探索) |
智能表现 | 离域任务(如下棋、语言模型) | 域特定任务(如攀爬未知地形) |
代表性技术 | 深度学习、大模型 | 演化机器人学、形态计算(Morphological Computation) |
其中要完成具身智能涉及到三大理论支柱
在了解了这个概念后,再看下我对AI时代第二大脑的构想。随着AI大模型能力的不断发展,我当初第二大脑的想法完全是可行的。当初我想法如下:

简单总结就是我们希望借助AI,大模型和智能体开发来构建一个和自己完全双向映射的数字孪生大脑,并真正成为个人的AI时代的数字身份。
在2023年随着GPT火热,我当时就一直在思考AI第二大脑构建的事情。即在AI和人工智能快速发展的情况下,如何通过AI来构建自己的第二大脑,或者叫做数字孪生大脑。
第二大脑不是代替个人,而是真正成为个人可以随时携带的一个私人助理。同时第二大脑也不是帮助你决策,而是如何更加高效的协助你决策。同时第二大脑不是传统借助IT工具和互联网下的个人知识库工具,而是一个真正了解你熟悉你,为你量身定做的一个超级AI智能体。
在这里,我先给出一个我所理解的第二大脑的定义。
第二大脑是充分借助AI工具构建的一个个人外部大脑,和第一大脑之间形成一种数字孪生关系,实现信息的相互互通和信息的实时映射。第二大脑是一个虚拟世界真实存在的,随着个人日常行为活动,信息摄取不断衍生发展的大脑。大脑本身随着第一大脑不断迭代持续进化,为第一大脑提供智能化助理和决策能力。类似AI反向训练人类的思路,第二大脑将持续促进第一大脑的快速迭代进化。
个人大脑的一个核心能力是思维能力,面对外界信息输入后快速做出回应的能力,这个人能力的本质是学习能力和解决问题的能力。学习能力重点是完成外界知识的加工和存储,而解决问题能力的能力完成面对新问题的时候调取大脑已有知识库快速去完成匹配和输出。
大脑首先要完成外界信息摄取后知识的存储和知识的沉淀问题。这是我们能够后续应用知识解决问题的关键。我从小学和大学知识的学习,更多的都是在完成知识的存储和沉淀过程。
大脑对于知识的获取和存储可以简化为下图:

从上图可以看到我们个体不断接触外界各种信息的输入,这些输入包括了文字,视频,语音等各种类型。同时又包括了类似书本,互联网,外界他人交流,自己的所见所闻多种渠道。最终通过眼耳鼻舌身意各种感官刺激,最终完成了信息的摄入,通过记忆将信息转换为知识库和记忆库。
对于记忆本身又分为短期记忆和长期记忆,对于长期使用的信息或知识,我们会参考遗忘曲线原理逐步遗忘掉。而对于长期使用的知识会转变为我们自己的长期记忆,同时这些知识经过我们自己的大量工作实践和复盘后,这些知识进一步转换为我们个人的经验和方法论,形成在记忆库上层的经验模式库。
在给出上图后,我当时提了两个问题:
可以看到前面传统的RAG知识库并不能很好的解决上面两个问题。而SecondMe产品提出的HMM(分层记忆模型)和Me-alignment(个性化对齐架构)正是我们需要的构建第二大脑的关键。
个人知识结构包括两大关键。
其一是知识结构,其二知识关联。
而知识结构经过抽象后本质就是两类知识模型,一种是围绕一个核心中心点展开的树状结构模型,这个复合常规人脑的思维希望,类似我们经常谈到的思维导图构建基本是这种模式。
第二种模式是结构化思维后,理解到事物的多面性,在抽象事物多面属性特征后构建的维度结构。但是复杂多维结构我们往往难以深入理解和研究,因此任何复杂多维结构最终可以转换为二维的表格结构进行研究。
对于知识结构中的知识关联,除了最简单经常谈到的任何一个知识点都存在前导知识和后导知识,因此静态的知识点通过前导和后导连接,可以构建一张完成的知识地图。在后期知识地图又衍生到了我们经常会谈到的知识图谱的概念。

知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库。通过识别关键的实体概念和关系,来构建了知识点之间的关联关系,这个是将RAG知识库上升到符合我们思维习惯的智能学习和推理模型的关键。
知识的应用-私有知识经验+公网信息
构建第二大脑的核心目标还是知识的应用。知识的应用本质是我们面对外界的新输入,快速的分析和解决问题的过程。在这个此过程中我们要快速的调取我们已有的知识记忆库,经验模式库来完成最终的分析和决策。这个过程本身也可以叫知识的推理过程,考验的是我们归纳演绎能力和模式匹配能力。
这里面的模式匹配就是知识应用的一个关键,模式匹配的过程在AI和人工智能出现后变成了人工神经网络和类似GPT的知识推理过程。但是整个过程的完成仍然是需要底层的知识库和经验模式库进行支撑。
当前GPT更多的是外网互联网知识库,而没有去结合自己构建的私有知识库,因此生成式AI的输出并不一定能够完全匹配我们的需求和业务场景。
对于知识应用和模式匹配过程进一步展开如下:

从这个图可以看到知识复杂应用或者叫复杂问题的解决往往需要调取三个方面的关键能力。
这三个方面的能力决定了你具备的解决复杂问题的能力。而不是靠你的记忆能力。在IT和互联网快速发展的情况下,记忆力往往并不重要,我们可以随时通过互联网海量知识库通过搜索获取。
对于第一代的个人知识管理工具更多的也就是在解决个人知识库构建的问题,但是其本质往往并没有提升你的思维能力和解决问题能力。而到了AI人工智能时代,我们希望如何构建第二大脑来解决上面3个方面的问题。
第二大脑不是简单的知识存储库,而是一个真正懂你的知识应用库。传统的第一代知识管理工具都是在解决知识最终形成后的存储过程。而没有去解决和分析知识形成的动态过程。
没有去跟踪动态知识形成过程,那么这个工具就不可能真正懂你,也无法懂你个体的行为特征和做事习惯,自然也就很难真正辅助你给出更多最佳的决策和判断。所以我们希望第二大脑在构建时候。
只有这样,第二大脑才可能是一个数字孪生大脑。这样构建的第二大脑模型和工具能够真正持续跟随第一大脑持续进化,同时又通过AI反向训练人类的思路促进第一大脑的持续进化。
人脑天生有缺陷。
这个缺陷一方面是记忆力有限,存在遗忘曲线规律,比如我们多年前实践过的有用经验和方法论由于长期不使用会被遗忘掉;第二方面是总结复盘精力不足,个人思维能力和解决问题能力的提升靠的是构建学习-实践-复盘的持续迭代优化过程。但是个人的精力很难真正做到每一件事情都认真复盘,同时更加难以一个长周期后多件类似事情展开抽象归纳并进行周期性复盘。
而这正是外部AI智能体的一个强项。
第二大脑的构建刚好可以弥补我们个人大脑在三个方面存在的不足。其一是个人经验模式库的构建和盘活问题,其二是外部海量信息和经验的实时获取问题,其三是如何面对复杂应用场景下的问题解构和快速匹配形成有价值的输出问题。
简单来说就是只要你能够持续给我信息的输入,包括静态的文档,图片等知识信息;又包括你个人的行为模式和行为特征信息。那么AI就可以7*24小时持续不断学习和进化。同时我借助外部互联网海量的知识经验库,来帮助你持续帮助你进化。
让我们还是回答人这个本体上面来进行思考。

为此,我绘制了一个示意图,其中核心观点是:人类智能文明演进的关键在于AI大脑的构建。回顾人类发展历程,意识与身体原本是不可分割的整体。人类通过感知现实世界,进而学习、记忆、推理,最终实现对现实世界的改造,这一过程推动了社会发展和科技进步。对于意识,我将其分为自我思考和推理的能力,一个是类似人的自我意识和情感。在这里我们先不去讨论AI是否具备自我意识的问题。
AI的革命和发展本身可能就存在两个关键。
其一就是意识的剥离,或者叫意识的辅助。类似我前面谈到的第二大脑的思路。通过AI来构建第二大脑,人的身体这个肉身仍然是AI大脑的载体。人存在的意义就是帮助AI完成所有的外在事物和信息的感知。类似当前的AI智能眼镜,完成关键的视角和声音的感知。但是这个实际还远远不够,类似人的感知好包括了立体空间的感知,触角的感知等。
所以我一直期望应该有一个轻便的可穿戴的AI设备,里面集成了听觉,触觉,味觉,视觉各种类似人的感知能力,通过人这个载体快速的完成外在信息的感知和输入。再通过强大的AI大模型后台能力完成相关的记忆,存储,推理,计算。正如我前面谈到的,这个AI大脑不再是点上的记忆存储,而是随着人的时间线的记忆存储,能够完全学习和记忆现实世界中人所有的行为和活动。这种一个刚长的空间+时间的信息感知和记忆,足够创造一个SecondMe。
其二才是叫肉身和意识的全部剥离。即前面谈到的类似具身智能能力的AI+人形机器人。这个机器人不再需要人这个载体去协助自己完成外在信息的感知和获取,机器人自己具备移动能力,具备强大的外在信息感知能力,同时依赖后端的AI大模型,能够快速的对感知信息进行学习和处理,而不是类似现在AI大模型上,大模型可能都是半年前知识长时间训练完成的结果能力。
人类的意识可能将融入后端云端核心的AI大脑能力,而人类的身体则可以被机器或各类人形机器人所替代。当这种转移发生后,机器将完全具备替代人类的能力。通过内置各类传感器,机器能够感知现实世界,并将感知到的信息交由AI大脑处理,进而执行相应的控制活动。
不论是上面那种革命性突破,实际关键能力都是在于AI需要突破外在外在信息的及时感知+快速处理能力。只要这个能力一突破,那么AI能力将产生质的飞跃。