
摘要:

刚刚,OpenAI CEO Sam Altman 在一场红杉闭门会中,再次分享了他对 AI 未来的深邃洞察和 OpenAI 的宏大蓝图。
这已经是他第三次出席该系列 AI 活动,而 OpenAI 的办公起点,正是这次活动的举办地。抚今追昔,Altman 感慨万千。
从 2016 年仅有 14 人的小型研究实验室,到如今搅动全球风云的 AI 巨擘,OpenAI 经历了怎样的蝶变?ChatGPT 的横空出世背后有哪些不为人知的故事?未来,OpenAI 又将如何定义我们与 AI 的交互方式?
让我们一同深入这场对话,探寻 Altman 描绘的「AI 人生操作系统」究竟为何物。
「你想象过 2016 年时,我们会是今天的样子吗?」面对主持人的提问,Altman 坦言:「没有。」
那时的 OpenAI,更像一个充满信念但缺乏明确行动计划的研究实验室。「我们大概 14 个人,围着白板讨论该做什么。别说公司或产品了,就连 LLM 这个想法都还很遥远。」
最初,他们尝试让 AI 玩视频游戏。「现在我们已经很擅长这个了,」Altman 笑称。英伟达 CEO 黄仁勋也曾亲手将第一台 DGX-1 系统送到这里,那台如今看起来「小巧」的机器,见证了 OpenAI 的萌芽。

从研究到产品的道路并非一帆风顺。Altman 透露,OpenAI 的第一个产品并非 ChatGPT,甚至也不是 DALL-E,而是 API。
「我们尝试了几个方向,比如机器人手、视频游戏等,想看看系统是否有效。后来有人,最初是一个人,然后是一个团队,对无监督学习和构建语言模型产生了兴趣,这才有了 GPT-1 和 GPT-2。」
到了 GPT-3 时代,OpenAI 意识到两件事:
「我们开始思考,如何让它成为一项能支撑所需投资的业务,同时也感觉到它正朝着真正有用的方向发展。」 Altman 回忆道。
此前,GPT-2 模型权重的发布并未激起太大水花。Altman 观察到 YC(Y Combinator)的许多公司通过 API 取得了成功,并且简化用户使用门槛能带来巨大好处。「我们想,运行这些模型太难了,它们越来越大。不如我们来写软件,把它们运行好。然后,我们不自己做产品(因为想不出来做什么),而是希望别人能找到应用场景。」
于是,大约在2020 年 6 月,OpenAI 发布了 GPT-3 的 API。
「世界大部分地区没太在意,但硅谷注意到了。他们觉得『哦,这有点酷,预示着什么』。」 Altman 说。当时,除了少数几家提供「文案写作即服务」的公司,几乎没人能用 GPT-3 API 构建起真正的业务。
但一个关键现象引起了 OpenAI 的注意:尽管用 API 搞业务很难,但人们非常喜欢在 Playground 里和 GPT-3 聊天,即使它当时并不擅长对话(RLHF 技术尚未成熟)。「除了文案写作,这几乎是 API 产品唯一的杀手级应用,最终引导我们构建了 ChatGPT。」
当 ChatGPT 3.5 问世时,能用 API 构建业务的领域从 1 个扩展到了大约 8 个。「但我们更加坚信,人们就是想和模型对话。」在 DALL-E 取得一定成功后,结合微调技术的进步,OpenAI 决心打造一款能让用户与模型畅所欲言的产品。
2022 年 11 月 30 日,ChatGPT 正式发布。如今,每周有超过 5 亿人与它对话。

在过去的六个月里,OpenAI 以前所未有的速度「疯狂输出」,产品迭代令人瞩目。一家规模已然不小的公司,如何保持甚至提升产品发布的速度和创新力?
Altman 分享了他的「反直觉」管理哲学:
「我们努力让相对少数的人承担巨大的责任,而实现这一点的途径就是做很多事情。」Altman 强调,「我们现在确实有机会去构建一个重要的互联网平台。」
谈及过去半年最自豪的发布,Altman 毫不犹豫地指向了模型本身:「模型现在太棒了。当然还有提升空间,我们也在快速努力。但我认为,ChatGPT 现在是一款非常好的产品,因为模型非常好。一个模型能如此出色地完成这么多事情,令我惊叹。」

那么,OpenAI 的星辰大海在哪里?面对初创企业如何避免成为「炮灰」的提问,Altman 清晰地阐述了 OpenAI 的定位:「我们想成为人们的『核心 AI 订阅』和使用 AI 的主要方式。」
这包括:
「是的,我们将致力于核心 AI 订阅和模型,以及核心服务。在此之外,将有大量其他东西可供构建。」Altman 鼓励创业者:「如果你能做出比我们更好的核心 AI 订阅产品,那就去做吧,那会很棒。」
这个「核心 AI 订阅」的终极形态是什么?Altman 描绘了一个惊人的愿景:
「理想状态是,一个非常小的推理模型,拥有万亿级别的上下文(token),你可以把你的一生都放进去。模型永不重新训练,权重永不定制化。但它能够高效地在你完整的上下文中进行推理。你一生中所有的对话、读过的每本书、每封邮件、你看过的每样东西,都储存在里面,并连接了你所有其他来源的数据。你的生活不断追加到上下文中,你的公司数据也一样。」
「我们今天还做不到,但这是我希望最终实现个性化定制的方式。」
Altman 观察到,不同年龄段用户使用 AI 的方式存在显著差异,这印证了他对 AI 未来的判断:
「他们真的把它当操作系统用,」Altman 说,「他们有复杂的方法来设置它,连接到大量文件,脑子里记着或者粘贴复制复杂的提示词。」 更令人惊讶的是,「他们在做人生重大决定前,会不先问问 ChatGPT 该怎么做。AI 拥有他们生活中每个人的完整背景信息和谈话记录,『记忆』功能在这里起到了关键作用。」
这种「操作系统」式的使用方式,正是 OpenAI 努力的方向——一个深度个性化、无处不在的 AI 助手。
对于 API 和开发者生态,Altman 有着更深远的思考。他希望,未来能出现一种「类似 HTTP 级别的新互联网协议」:
「事物将变得更加联合和分解成更小的组件,智能体不断暴露和使用不同的工具。身份验证、支付、数据传输都内置在这个每个人都信任的层级,万物互联。」
他承认,目前 API 距离这个愿景还很远,但「我们正从迷雾中逐渐看清方向,可能需要几次迭代才能达到。」 最终目标是让这个平台「催生难以置信的财富创造」。
如何才能构建出越来越智能的模型?Altman 指出了三大核心要素:算法、数据、算力。
「最具杠杆作用的仍然是重大的算法突破。我认为可能还有几次 10 倍甚至 100 倍的突破机会——虽然不多,但一两次就不得了。」
在具体技术方向上,Altman 特别强调了语音和编程的重要性:
这意味着,AI 将从「助手」进化到「智能体」,再到「应用程序」。
当被问及是否有「被低估的成功要素」时,Altman 坚持了这三大支柱,暗示着在这些基础领域持续深耕的重要性。他也提到,向模型输入传感器数据(如温度等物理世界信息)以增强其对现实的理解,用户已经在这么做了,最新模型对此处理得不错,未来可能会更明确地内置这一功能。
对于大型企业在 AI 浪潮中的缓慢反应,Altman 表示「失望但不惊讶」:「这在每次重大技术革命中都会发生。他们的问题在于固守成规。」他预测,这些大公司会再「挣扎」几年,假装 AI 不会重塑一切,然后最终「投降」,但为时已晚,初创公司早已凭借敏捷性超越。
这种现象也体现在个人层面,他再次提到不同代际对 AI 工具的接受程度差异巨大,如同智能手机诞生之初。
对于 OpenAI 自身,Altman 强调其战略的灵活性:「我们没有那种从疯狂复杂目标倒推的宏伟计划。我们更相信做好眼前事。」他们清楚需要海量的 AI 基础设施、不断优化的模型和顶级的消费产品,但具体的产品形态会随着世界的变化而调整。「我们为自己的敏捷和适应性感到自豪。明年要做的产品,现在可能都还没开始想。」
这种「向前工作」而非「向后倒推」的理念,贯穿了 OpenAI 的发展。
访谈中,Altman 罕见地给出了未来几年的 AI 发展预测:
那么,万众瞩目的 GPT-5 呢?当被问及 GPT-5 是否会比在场所有人都聪明时,Altman 并没有正面回答,而是给出了一个耐人寻味的回答:
「嗯,如果你觉得你比 o3 聪明很多,那可能还有一段路要走。o3 已经相当聪明了。」
经历过 OpenAI 内部动荡的 Altman,也分享了他对创始人韧性的感悟:
「随着时间的推移,事情会变得更容易。作为创始人,你会面临很多逆境,挑战越来越难,风险越来越高,但当你经历更多糟糕的事情后,情感上的代价会减轻。」
他认为,最难的不是危机发生的时刻,而是危机过后的『余波』。「在危急时刻,你能得到很多支持,肾上腺素飙升,你能挺过去。但如何收拾残局,如何重建,这方面的讨论很少,却至关重要。这是你可以练习并做得更好的地方。」
从一个小小的研究实验室出发,怀揣着对通用人工智能的坚定信念,Sam Altman 带领下的 OpenAI 正以前所未有的速度,将人类带入一个由 AI 深度赋能的新纪元。
「核心 AI 订阅」、「人生操作系统」、智能体、科学发现的加速、物理世界机器人的普及……Altman 描绘的蓝图令人心潮澎湃。尽管挑战重重,不确定性依旧存在,但正如他所言:「我对我们的研究路线图从未像现在这样乐观。」
AI 的未来已来,而这,仅仅是开始。