关于OpenAI的GPT-4预计将于本周发布,传言四起。德国出版物Heise报道称,微软德国首席技术官Andreas Braun上周在一场人工智能启动活动上开始铺垫。
Heise援引Braun的话说:“我们下周将推出GPT-4,在那里我们将有多模态模型,它们将提供完全不同的可能性,例如视频。”微软斥资100亿美元收购OpenAI49%的股份,成为OpenAI的主要投资者,并将OpenAI的技术整合到其Bing搜索引擎中。
多模态人工智能系统可以处理文本、图像、音频和视频形式的数据。ChatGPT是最著名的聊天机器人,由大型语言模型(GPT-Generative Pre-trained Transformer模型)驱动,但只能处理文本。它是在GPT-3.5上进行了微调,GPT-3.5是去年11月悄悄发布的版本。
凭借其新的多模态功能,兴奋的用户期望ChatGPT能够同时理解和综合多种类型数据的含义和上下文,从文本到视频功能以及其他模式都有可能。例如,用户可以向ChatGPT显示一张图片,并向其询问图像中的人或物体是什么关系,或者,他们可能会要求它根据图像或视频的内容写一个故事。
OpenAI于去年9月开始训练GPT-4。一张席卷推特的图片声称,GPT-4将由100万亿参数的训练,而GPT-3的参数仅为1750亿,这将使GPT-4的功能提高500倍。然而,在上个月接受StrictlyVC采访时,OpenAI首席执行官Sam Altman称100万亿参数“完全是胡说八道”。
这就是推特上流传一张图片,该图片声称GPT-4是在100万亿个参数上训练的。
Altman在采访中说:“那些关于GPT-4的谣言是一件荒谬的事情。”当被问及GPT-4何时发布时,他表示,GPT-4将在安全和负责任的情况下发布。同时表示,不要把GPT-4想象的太完美,它有可能也会让人失望。
另一个在推特上流传甚广的传言,微软将于3月16日星期四上午8点在直播活动中宣布GPT-4的发布。该活动名为“重塑生产力:人工智能的未来”,将由微软首席执行官Satya Nadella和微软365首席执行官Jared Spataro共同讨论“人工智能将为每个人和组织带来一种新的工作方式”。
虽然GPT-4宣传热度和粉丝口碑甚嚣尘上,但其带来的失望可能也会随之而来。LLM的核心是概率机器,它使用复杂的算法通过搜索模式来预测文本的顺序,依然不会完美。尽管人们多么希望这些模型能够自己形成思想,这是通用人工智能的一个标志。
著名语言学家Noam Chomsky上周在《纽约时报》上写到了这一点,他说:“不管这些程序在某些特别领域中多有用(例如,它们在计算机编程或撰写论文方面都很有用)”我们从语言学和知识哲学中知道,它们与人类推理和使用语言的方式有着深刻的不同。这些差异极大地限制了这些程序的功能,使其编码存在无法消除的缺陷。”
编者注:本文发布时,GPT-4已经正式发布。我们看到许多国内不明机构号称可以体验或者试用GPT-4,这里也提醒读者冷静对待,谨防上当受骗。
领取专属 10元无门槛券
私享最新 技术干货