部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >AI届的拼多多登临iOS榜,DeepSeek到底是什么来头?

AI届的拼多多登临iOS榜,DeepSeek到底是什么来头?

作者头像
AntDream
发布2025-02-04 14:36:37
发布2025-02-04 14:36:37
1880
举报

DeepSeek的App目前已经登陆iOS免费榜前十,并超过了Google Gemini和微软的Copilot等同类竞品,可谓异军突起。

DeepSeek(深度求索)是一家专注于开发先进大语言模型(LLM)和相关技术的创新型科技公司,成立于 2023 年 7 月 17 日,总部位于杭州。

发展历史

  • 2023 年 11 月 2 日:DeepSeek 发布了首个开源模型 DeepSeek Coder,这是一个支持多种编程语言的代码生成和调试模型。
  • 2023 年 11 月 29 日:DeepSeek 发布了参数规模达 670 亿的通用大模型 DeepSeek LLM,包括 7B 和 67B 的 base 及 chat 版本。
  • 2024 年 12 月 26 日:DeepSeek 发布了 DeepSeek-V3,这是一个基于混合专家(MoE)架构的大型语言模型,参数量高达 671B,在多个基准测试中表现出色。
  • 2025 年 1 月 20 日:DeepSeek 发布了 DeepSeek-R1,这是一个高性能 AI 推理模型,性能直逼 OpenAI 的 o1 正式版,并支持开源和免费商用。

产品特色与优势

  1. 开源与商用
    • DeepSeek 的模型完全开源,用户可以在 GitHub 等平台上自由获取和修改模型代码。
    • 支持商用,用户无需申请授权即可使用模型进行商业活动。
  2. 高性能
    • DeepSeek 的模型在多个基准测试中表现出色,尤其是在数学推理、代码生成和自然语言理解等领域。
    • DeepSeek-V3 在 Aider 多语言编程测试排行榜中超越了多个知名模型。
  3. 低成本
    • DeepSeek 的 API 定价非常亲民,缓存命中每百万输入 tokens 仅需 1 元,未命中为 4 元;输出 tokens 每百万定价为 16 元。
    • DeepSeek-V3 的训练成本远低于其他同类模型,仅用 2048 块 Nvidia H800 芯片训练两个月,成本约为 558 万美元。
  4. 多模态支持
    • DeepSeek-R1 支持多模态输入输出,能够处理文本、图像等多种类型的数据。
  5. 强化学习技术
    • DeepSeek-R1 在后训练阶段大规模应用了强化学习技术,显著提升了模型的推理能力。

最新产品:DeepSeek-R1

产品介绍

DeepSeek-R1 是 DeepSeek 于 2025 年 1 月 20 日发布的最新 AI 推理模型,性能直逼 OpenAI 的 o1 正式版。该模型在数学、代码和自然语言推理等任务上表现出色,被认为是国产 AI 技术的重大突破。

技术突破
  1. 强化学习驱动的推理能力
    • DeepSeek-R1 在后训练阶段大规模应用了强化学习技术,显著提升了模型的推理能力。
    • 该模型在极少标注数据的情况下,依然能够取得优秀的性能。
  2. 长链推理与模型蒸馏
    • DeepSeek-R1 支持长链推理,能够在复杂任务中表现出色。
    • 通过模型蒸馏技术,DeepSeek 还开源了 6 个小模型,包括 32B 和 70B 参数的模型,这些小模型在多项能力上超越了 OpenAI 的 o1-mini。
  3. 多模态支持
    • DeepSeek-R1 支持多模态输入输出,能够处理文本、图像等多种类型的数据。
应用场景
  • 文本生成:DeepSeek-R1 可以用于生成高质量的文本内容,如文章、报告等。
  • 代码生成:该模型在代码生成和调试方面表现出色,能够生成高质量的代码。
  • 复杂问题推理:DeepSeek-R1 在数学推理、自然语言理解和复杂问题推理等任务上表现出色。

总结

DeepSeek 作为一家新兴的 AI 科技公司,通过不断创新和技术突破,推出了多款高性能、低成本的 AI 模型,如 DeepSeek Coder、DeepSeek LLM、DeepSeek-V3 和 DeepSeek-R1。这些模型在多个领域表现出色,尤其是在数学推理、代码生成和自然语言理解等方面。

DeepSeek 的开源策略和低成本定价进一步降低了 AI 技术的门槛,为全球开发者和企业提供了新的选择。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AntDream 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 发展历史
  • 产品特色与优势
  • 最新产品:DeepSeek-R1
    • 产品介绍
    • 技术突破
    • 应用场景
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档