人工智能的研究有两个方向,一个是用大量的if-then(也就是如果-就的逻辑)来规则定义,另一个就是用神经网络的方式。
if-then的规则比较易于理解,系统决策过程有比较高的可解析性,它的本质就是直接利用现成知识领域里的专业知识,通过编码规则的方式把知识转化成易于机器理解和执行的形式。
这种方式比较适合已经有明确知识结构的领域,如果面对的是规则之外、复杂多变的环境,它的适应性就比较差。你可以把它看作是一种自上而下的设计思路。
神经网络的方式,则是通过学习大量数据,并善于发现数据特征和规律,它没有更多预先定义好的规则,所以在面对复杂、模糊的问题上,有更强的适应性。
在笔者之前的文章里有所提及其工作原理《AI设计思路:持续窥探聪明人是如何思考?》。
神经网络比if-then的规则更擅长于处理非线性的问题,所以它们的应用范围更广泛,包括图像识别、自然语言的处理等。但它的缺点也很明显,它需要大量的数据和计算资源,如果没有这两个基础,神经网络的处理能力将非常受限。你可以把它看作是一种自下而上的设计思路。
现在我们所使用的ChatGPT,就是神经网络的范畴,就数据和算力来看,GPT-4的训练数据规模虽然没有真正披露,但我们可以侧面从训练参数规模去推测。
目前GPT-4的训练参数规模大约为1.8万亿个,而GPT-3的参数规模只有1750亿个,10倍的参数规模意味着更强的学习能力和表现能力。而应用在GPT-3的原始文本数据大约是45TB,为了避免模型的过度拟合,参数规模的提升将对应着训练数据规模的提升,但至于需要提升到什么量级,应该会是GPT-3数据规模的1-2个数量级。
在算力层面,GPT-4在25000张A100 GPU显卡上训练了100天,单纯这次的训练成本约为6300万美元,而GPT-3的训练成本则介于200-1200万美元之间。
上面所说的只是训练的部分,因为大模型的训练和推理的计算是分离的,所谓训练是要求利用更多的资源去处理大量的数据和复杂的模型结构,而推理则是在模型已经训练好之后进行的,可以理解为就是我们终端的应用场景。
不难看出,为了确保神经网络这种迭代方式下模型的准确性,数据和算力可以说是现代人工智能企业的兵家必争之地。
80年前,早在1943年神经网络的概念就被提出来了,但在那个既缺乏数据,又缺乏算力的年代,神经网络作为一个计算模型理论,直到1957年才有了较为准确的定义:感知器。
你可以把感知器看作是一个最简单的"神经元",它会接收多个输入,然后基于不同输入的权重,再确定输出的结果将会是什么,它就类似一个二元分类器,试图去找到一个决策的边界,将数据划分。
举个例子,如果沙滩上左边放着红色气球,右边放着绿色气球,你确实可以通过一条直线或者一个平面把他们划分开来,输出的结果要么是红球要么是绿球,这个数据集就属于线性可分类的数据。
但如果这些红色气球和绿色气球都散乱地分布在沙滩上,你无法用单一一条直线或者一个平面把他们划分开来,如果一定要划分,那么可以用多条直线来划分,对应在感知器上就是多层的神经网络来解决非线性的问题。
理论上,这是一个突破的解决方式,但奈何当时的计算能力无法处理多层的神经网络的计算,所以才导致了神经网络的研究停滞了。
后来,随着游戏和专业图形设计领域的显示要求不断提升,才迫使GPU的高速发展,而GPU的设计之初就是为了处理图形渲染任务,本身图形渲染就是计算密集型的业务,涉及对大量数据处理和复杂的数学运算,竟然和深度学习算法所需的计算特点不谋而合。
计算能力的突破,让神经网络的迭代加快了速度,逐渐衍生出一些神经网络的精髓:非线性、分布式、并行计算、自适应和自组织,在一定程度上得到了市场的认可。
非线性的本质,是指输出的内容并非输入内容的直接"换算"关系,也意味了非常微小变化的输入内容,也会导致输出结果产生巨大的变化。这个特性的作用在于神经网络能捕捉现实数据中的复杂关系,不再局限于处理单一的问题。
分布式则意味着模型信息并非集中存放,而是分布在网络的多个神经元中,这种方式使得模型的容错能力增强,即使一部分受损仍不影响决策质量,是模型反脆弱的一种表现。
因为游戏的吸金能力强,游戏的可玩性因为更好的画质而不断提高,用户愿意为更好的游戏、更好的画质而付费,厂商愿意为更好的画质推出更强劲的GPU,从而带动了整条产业链,最终才造就了上面所说神经网络的"优势"。
再次证明,进化总是聪明的,伟大并不能被计划。任何一厢情愿的执念,最终可能都抵不过岁月的无情,对于我们的启发是:
成功不能简单被复制,但成功的方式却能被识别出来。神经网络的早期发展关键在于数据和算力的制约,任何一个变量的高速发展,都能带动这个行业走向新的高度。
创新的本质,也许不是坐在房间里,每天努力去思考那些伟大的想法,更多的可能性也许是学会识别尽可能多的、增长速度快的、能够自发涌现出来的一些局部性优势,建立斤可能多的网络连接,然后我们把资源都布局于此。
噢,对了,还有一点最重要的,就是要放弃主观预测,进化永远比人聪明。
你在这里能得到什么?
我始终认为:最有价值的时刻,在于你是否真正捕获了更多客观的一手信息,并修补了以前自己错误的观点,得到一些启发,这是你和大多数人真正拉开距离的时刻。
你能在这里能得到一些启发,偶尔一两个就够了,人的差距在于思维模式的差异。
文章表达个人观点仅供参考,不构成对所述资产投资建议,投资有风险,入市须谨慎.
领取专属 10元无门槛券
私享最新 技术干货