部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >0 帧起步,腾讯云 TI 平台 5 分钟 私有化 DeepSeek

0 帧起步,腾讯云 TI 平台 5 分钟 私有化 DeepSeek

原创
作者头像
不惑
修改2025-02-06 14:56:02
修改2025-02-06 14:56:02
6530
举报
文章被收录于专栏:GoboyGoboy

新年本应该祝福满屏的朋友圈,忽然间被 Deepseek 刷屏,这款被《黑神话:悟空》的制作人冯骥的评述:“DeepSeek可能是国运级别的科技成果。至今已在160多个国家的应用商店屠榜。

DeepSeek的最新模型DeepSeek-V3和DeepSeek-R1确实属于MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是2025年1月开源的DeepSeek-R1,其模型性能可挑战OpenAI闭源的o1模型。

DeepSeek-V3和DeepSeek-R1的技术和架构分析

  • DeepSeek-V3:该模型采用了MoE架构,拥有6710亿参数,训练成本仅为558万美元,推理成本1~2元/百万tokens。V3通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。其重要架构改进包括多头潜在注意力(MLA)和DeepSeekMoe,这些创新使得V3在长上下文推理中表现出色。
  • DeepSeek-R1:R1模型在V3的基础上进一步优化,采用了纯强化学习技术路线,能够在仅有极少标注数据的情况下,极大提升了模型推理能力。R1的训练成本为560万美元,但其推理能力与OpenAI o1相当,且在数学、代码、自然语言推理等任务上表现出色。

“国运级创新”的讨论

  • 技术创新:DeepSeek的V3和R1模型确实在技术和架构上实现了多项创新,如MLA、DeepSeekMoe、多Token预测(MTP)等,这些创新显著提高了模型的效率和性能,降低了训练和推理成本。
  • 误传与质疑:尽管DeepSeek的技术成就值得肯定,但也存在一些误传和质疑。例如,有外界人士认为DeepSeek可能在训练过程中使用了OpenAI的模型数据,尽管DeepSeek团队否认了这一点。此外,DeepSeek的高调宣传和“打破CUDA垄断”等说法也被一些媒体和专家视为过度炒作。

DeepSeek的V3和R1模型在技术和架构上的创新是显而易见的,这些创新不仅提高了模型的性能和效率,也对AI行业的未来发展产生了积极影响。然而,关于“国运级创新”的说法可能过于夸大,DeepSeek的成功更多地是技术创新和商业模式创新的结合,而非单一的技术突破。

腾讯云TI平台

腾讯云TI平台是基于腾讯AI能力与技术经验,为开发者和政企打造的全栈式开发服务平台。它贯通产业+AI落地全流程,包括数据获取到AI应用开发各环节,助用户创建部署AI应用、管理全周期解决方案,推动政企数字化转型和AI生态共建,其系列产品支持公有云、私有化和专属云部署。

DeepSeek 系列模型

DeepSeek系列模型是一组全新的大型语言模型,旨在提供高效、灵活且强大的自然语言处理能力。该系列模型通过创新的架构设计和优化算法,支持多种任务和应用场景,包括文本生成、对话系统、信息检索等。

系列模型清单

推理资源要求:DeepSeek-V3 与 DeepSeek-R1 需要多机分布式部署,2节点H20*8卡资源,其他蒸馏模型所需资源详见大模型推理所需资源指南

模型体验(DeepSeek-R1)

新建在线服务

创建在线的DeepSeek-R1服务

这里我们需要充值2个小时的费用,相当于上网吧的上网费,腾讯云好用不贵,很是优惠。

在上面的算力规格中,要选择正确的配置信息。否则将会出现以下的错误提示。

R1每小时的费用仅需11.17元.

创建中

就绪中

运行中,当我们看到这个状态的时候,说明我们已经可以使用自己的 Deepseek 了。

调用API

调用API(应用程序编程接口)是指在一个软件系统中,通过特定的协议和接口,向另一个软件系统请求服务或数据的过程。API是一组预定义的规则和工具,用于构建和交互软件应用程序,它定义了不同软件实体之间如何相互通信,使得开发者可以轻松地利用已有的功能和服务,从而提高开发效率

在线体验

关闭服务

在使用DeepSeek的过程中,需要注意的是,该服务会根据实际使用情况产生相应的费用。因此,当您不再需要使用DeepSeek时,务必要记得及时停止相关服务。这一步骤非常重要,可以有效避免因疏忽而产生不必要的费用支出。通过合理管理服务的启停,您不仅能优化使用体验,还能更好地控制成本,确保资源的有效利用。

停止中

已停止

最后,现在就开始 DeepSeek-R1 的 部署,开启你的 AI 探索之旅吧,祝您问道成功~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 腾讯云TI平台
  • DeepSeek 系列模型
  • 系列模型清单
  • 模型体验(DeepSeek-R1)
  • 新建在线服务
  • 调用API
  • 在线体验
  • 关闭服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档