我最近几个月都在忙着全球市场调研和钛媒体海外办公室的筹建,所以发布视频有一搭没一搭,但没想到我这样任性的博主,也能收到很多用户的催更和问询了,比如很多人在问我GPT-5为何还没发布啊,硅谷最近有爆发什么新的创业应用方向吗等等。
我能感受到大家很着急很焦虑,但我们现在需要更多的是耐心不是着急。几个月前我就在一个公开演讲里预言,大家期望的今年作为大模型应用爆发元年可能不会来到,说爆发还为时尚早,只能算开始。
大模型这几个月的发展验证了我的说法。包括硅谷最近在技术圈也一直流传一个说法那就是GPT-5的内部测试失败了,今年已不大可能推出。因为基于Transformer的GPT类模型已经进入了扩展瓶颈,且除了聊天和一些比如编程、文本、设计、办公等工作流辅助类应用,很难全面应用于市场,而这些GPT-4o已经足够支撑。原有架构再升级短期内很难有质的突破。这些瓶颈包括模型自身架构扩展能力,也包括数据瓶颈,甚至也包括安全和伦理需求的应对瓶颈,还有因为应用局限带来的市场需求本身的瓶颈。
而一贯更善于追随的中国大模型和应用创业者们又是否为此做好了变道的准备?
这个瓶颈期会有多长,还很难判断,但无论是三个月、半年还是一年或更长,可能对于我们来说都会是比较难熬的一段时间。
好消息是,基于美国一些科技媒体的报道猜测,还有我从多方面了解的信息,OpenAI可能正在考虑推出一个新的模型方向产品,不再局限于Transformer的架构,或被命名为“Orion”(也有人说或被命名GPT-NEXT),Orion是猎户座(Orion)的拉丁名称,象征着力量、探险和发现,具有强烈的探索未知的神话意义,NASA的猎户座飞船(Orion spacecraft)也以此命名,用于未来载人深空探索任务。
如果最终真的以此代号命名,或许暗示了OpenAI将此作为AI真正新纪元的开始,而非此前的GPT。但目前对于这一代号,OpenAI官方是既没有承认也没有否认的状态。Orion模型也是OpenAI内部代号为“草莓”(Strawberry)系统项目的一部分,有报道称在内部演示草莓系统,Orion模型的推理能力已经远高于GPT,幻觉极错误率却远低于GPT。
根据多方面的信息,我总结了几点Orion可能和GPT模型的不同,Orion虽然仍可以被归类为大语言模型(LLMs),但它可能在技术架构上与现有的GPT系列有显著的不同。以下是一些可能的技术差异和演进方向:
1. 基础架构的演进
2. 多模态能力
3. 安全性与可控性
4. 优化计算与能源效率
5. 应用场景的扩展
总之,Orion作为大语言模型的发展方向,可能会在架构、功能和应用场景上进行显著的拓展和改进。
至于未来Orion和GPT会是什么关系,是短期的应对瓶颈期的权宜之计,还是长期对GPT的替代,亦或是两种模型路线各自升级的并存,可能都要有待于在OpenAI的发展中确定了,我们只能拭目以待。
领取专属 10元无门槛券
私享最新 技术干货