【ITBEAR】2024年,国内多家曾立志成为“中国OpenAI”的模型公司开始调整战略方向。据了解,被称为“AI六小虎”的六家中国大模型独角兽中,已有两家逐步放弃预训练模型,缩减预训练算法团队,转而聚焦AI应用的发展。
这一转折点的出现并非偶然。预训练阶段对于大模型而言至关重要,它决定了模型的性能,也是模型厂商的核心技术壁垒。然而,随着第三方预训练模型性能的提升,应用层企业开始放弃预训练,专注于后训练环节,以节省算力成本。
硅谷的明星AI企业Character.AI在2024年8月也宣布了类似的战略调整,他们选择与第三方模型合作,以投入更多资源于后训练,创造新的产品体验。然而,对于模型层企业而言,放弃预训练意味着主动退出AGI的激烈竞争。
放弃预训练并非全然消极的信号。在资金、算力紧缺的当下,大模型厂商开始对自身能力和资源进行重新评估。从模型转向应用,意味着在追求AGI之前,AI公司选择了先确保生存。
预训练的主流路径是狂堆参数的Scaling Law,但这意味着高昂且持续的算力和数据投入。对于尚未盈利的创业公司而言,继续堆参数炼模型面临着巨大的资金压力。因此,不少国内模型厂商开始借助“数据+场景”的优势,在AI应用上发力。
规模化的AI应用逐渐代替了领先的模型性能,成为模型厂商留在AI牌桌上的筹码。用户数据成为了模型厂商不得不重视的指标。然而,AI产品的差异化程度还不够,砸钱买流量几乎是获客的唯一出路。
大模型公司面临着变现的焦虑。目前靠大模型本身并没有明晰的变现渠道。模型API的降价并没有提高模型的营收能力,反而导致了ToB业务营收的下滑。开源模型的强大竞争力进一步削弱了闭源模型的付费转化。
在技术瓶颈和变现压力的双重困扰下,大模型厂商开始寻找新的出路。放弃预训练的厂商抓住了尚有盈利潜力的AI应用,而仍在坚持预训练的厂商则开始在技术上降本增效。
对于整个AI行业而言,放弃预训练模型并不意味着失败或消极。相反,它标志着厂商从技术狂热重回理性,开始重新思考和整合技术范式和行业资源。
领取专属 10元无门槛券
私享最新 技术干货