首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >DeepSeek 尘埃落定后你需要知道的三件事

DeepSeek 尘埃落定后你需要知道的三件事

作者头像
大脸猫不吃鱼
发布2025-02-05 18:13:06
发布2025-02-05 18:13:06
1280
举报
文章被收录于专栏:啥是AI啊?啥是AI啊?

单个新 AI 模型的推出通常不会在科技圈外引起太大轰动,也不会吓坏投资者,导致股市蒸发 1 万亿美元。现在,距离 DeepSeek 的辉煌时刻已经过去了几周,尘埃已经平息了一些。新闻周期已经转向更平静的事情,然而,在人工智能领域,DeepSeek 可能在长期内产生什么样的影响?以下是 DeepSeek 种下的三颗种子,即使最初的炒作逐渐消退,它们仍会生根发芽。

首先,它引发了一场争论:为了寻求更好的答案,人工智能模型应该消耗多少能源。 

您可能已经听说过,DeepSeek 非常节能。这对于训练阶段来说确实如此,但对于推理(即当您实际向模型询问问题并由模型给出答案时)来说,这很复杂。它使用一种思路链技术,将复杂的问题(例如是否可以撒谎来保护某人的感情)分解成块,然后合乎逻辑地回答每个问题。这种方法使像 DeepSeek 这样的模型在数学、逻辑、编码等方面表现更好。 

至少对某些人来说,问题在于这种“思考”方式比我们习惯的人工智能消耗更多的电力。尽管目前人工智能只占全球总排放量的一小部分,但越来越多的政治支持大幅增加人工智能的能源使用量。当然,思维链模型的能源强度是否值得,取决于我们使用人工智能的目的。治疗世界上最严重疾病的科学研究似乎是值得的。产生人工智能废物?就没那么值得了。 

一些专家担心,DeepSeek 的出色表现将促使各大公司将其整合到大量应用和设备中,而用户则会在不需要的情况下使用它。(例如,让 DeepSeek 解释爱因斯坦的相对论是一种浪费,因为它不需要逻辑推理步骤,任何典型的 AI 聊天模型都可以用更少的时间和精力做到这一点。)

其次,DeepSeek 在训练方法上取得了一些创造性的进步,其他公司可能会效仿。 

先进的人工智能模型不仅仅通过大量文本、图像和视频进行学习。它们严重依赖人类来清理数据、对其进行注释,并帮助人工智能选择更好的答案,而这些工作通常只需要支付微薄的报酬。 

人类工作者参与的一种方式是通过一种称为强化学习和人类反馈的技术。模型生成答案,人类评估者对该答案进行评分,这些分数用于改进模型。OpenAI 是这项技术的先驱,但它现在已被业界广泛使用。 

正如我的同事 Will Douglas Heaven 所报道的,DeepSeek 做了一些不同的事情:它找到了一种自动化评分和强化学习过程的方法。“跳过或减少人工反馈——这是一件大事,”阿里巴巴前研究总监、现任以色列 AI 编码初创公司 Qodo 联合创始人兼首席执行官的 Itamar Friedman 告诉他。“你几乎完全是在训练模型,而不需要人类做任何工作。” 

它对数学和编码等科目特别有效,但对其他科目则不太有效,因此仍然需要依靠工人。不过,DeepSeek 更进一步,使用的技术让人想起谷歌 DeepMind 在 2016 年训练其 AI 模型以在围棋游戏中脱颖而出,本质上是让它规划出可能的走法并评估其结果。这些进步,尤其是因为它们在 DeepSeek 的开源文档中被广泛概述,肯定会被其他公司效仿。

第三,它的成功将引发一场关键辩论:你能否推动人工智能研究向所有人开放,同时推动美国与中国的竞争力?

早在 DeepSeek 免费发布其模型之前,某些 AI 公司就认为该行业需要公开透明。他们认为,如果研究人员遵守某些开源原则并展示他们的工作成果,那么开发超级人工智能的全球竞赛就可以被视为一项为公众利益而开展的科学努力,任何一个参与者的权力都会受到其他参与者的制衡。

这是个好主意。Meta 在很大程度上支持这一愿景,风险投资家 Marc Andreessen 表示,开源方法比政府监管更能有效地保护人工智能的安全。OpenAI 则持相反观点,它封闭自己的模型,理由是这可以帮助它们免受坏人的侵害。 

DeepSeek 让这些叙述变得有点混乱。“我们站在了历史的错误一边,需要想出一个不同的开源策略,”OpenAI 的 Sam Altman周五在 Reddit AMA 上表示,考虑到 OpenAI 过去的立场,这令人惊讶。包括特朗普在内的其他人也加倍强调了提高美国在人工智能领域的竞争力的必要性,将 DeepSeek 的成功视为一个警钟。接下来的几个月以及 DeepSeek 和其他公司未来推出的产品将对这些论点进行压力测试。 

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档