Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >有容乃大,刚刚NVIDIA NIM集成DeepSeek,正式上线

有容乃大,刚刚NVIDIA NIM集成DeepSeek,正式上线

作者头像
GPUS Lady
发布于 2025-02-04 13:28:01
发布于 2025-02-04 13:28:01
3220
举报
文章被收录于专栏:GPUS开发者GPUS开发者

这个春节真是热闹非凡,大家还沉浸在节日的喜悦中,并热议着DeepSeek如何在美国股市掀起波澜,让NVIDIA股票在一夜之间下跌了17%。当大家纷纷揣测“这下梁子可结大了”的时候,NVIDIA却迅速做出了反应,在NVIDIA NIM上集成了DeepSeek R1版本。这一系列事件无疑为这个蛇年春节增添了几分不同寻常的科技色彩。

DeepSeek-R1是一款拥有顶尖推理能力的开源模型。与直接提供答案的模型不同,DeepSeek-R1等推理模型会对查询进行多次推理传递,运用思维链、共识和搜索方法,以生成最佳答案。这种通过推理来得出最佳答案的推理传递序列,被称为测试时扩展(Test-Time Scaling)。DeepSeek-R1正是这一扩展定律的典范,展示了加速计算对于代理式AI推理需求的重要性。

在允许模型迭代“思考”问题的过程中,它们会产生更多的输出标记和更长的生成周期,从而持续提升模型质量。对于DeepSeek-R1等推理模型而言,显著的测试时计算资源是实现实时推理和更高质量回答的关键,这也要求更大的推理部署规模。

DeepSeek-R1在逻辑推理、数学、编程和语言理解等任务中表现出卓越的准确性,同时保持了高效的推理效率。为了帮助开发者安全地测试这些功能并构建自己的专用代理,拥有6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在build.nvidia.com上提供。该微服务在单个NVIDIA HGX H200系统上每秒可处理高达3872个标记。

开发者可以测试和体验DeepSeek-R1的应用程序编程接口(API),该API预计很快将作为NVIDIA AI Enterprise软件平台的一部分,以可下载的NIM微服务形式发布。

DeepSeek-R1 NIM微服务通过支持行业标准API简化了部署流程。企业可以在其首选的加速计算基础设施上运行NIM微服务,以最大限度地提高安全性和数据隐私。借助NVIDIA AI Foundry和NVIDIA NeMo软件,企业还能够为专用AI代理创建定制的DeepSeek-R1 NIM微服务。

DeepSeek-R1:测试时扩展的完美典范

DeepSeek-R1是一款大型专家混合(MoE)模型,拥有令人印象深刻的6710亿参数,比许多其他流行的开源大型语言模型多10倍,支持长达128000个标记的输入上下文。该模型每层还使用了极多的专家,每层有256个专家,每个标记会并行路由到八个单独的专家进行评估。

为DeepSeek-R1提供实时回答需要多个高性能GPU,它们通过高带宽和低延迟的通信连接,以将提示标记路由到所有专家进行推理。结合NVIDIA NIM微服务中的软件优化,使用NVLink和NVLink Switch连接的单个服务器上的八个H200 GPU可以以每秒高达3872个标记的速度运行完整的6710亿参数DeepSeek-R1模型。这一吞吐量得益于每层使用NVIDIA Hopper架构的FP8 Transformer引擎,以及用于MoE专家通信的900 GB/s NVLink带宽。

对于GPU而言,充分利用每秒浮点运算次数(FLOPS)的性能对于实时推理至关重要。下一代NVIDIA Blackwell架构将通过第五代Tensor Core为DeepSeek-R1等推理模型的测试时扩展提供巨大提升,其峰值FP4计算能力可达20 petaflops,并拥有一个专为推理优化的72 GPU NVLink域。

DeepSeek-R1凭借其顶尖的推理能力、高效的推理效率和灵活的部署选项,正成为AI推理领域的新标杆,为开发者和企业提供了强大的工具和支持。

我们的观点

在这个充满挑战与机遇的蛇年春节里,DeepSeek-R1的发布无疑为科技界带来了一场别开生面的盛宴。从股市的波澜到技术的突破,每一个瞬间都见证了科技发展的无限可能。而在这场没有硝烟的较量中,我们深刻体会到,科技并非零和游戏,没有绝对的赢家或输家。真正能够引领未来的,是那些能够携手共进,共同构建开放、协作生态的参与者。

在这个快速变化的时代,有容乃大不仅是为人处世的智慧,更是科技发展的必由之路。只有当我们以开放的心态去拥抱创新,以协作的精神去推动进步,才能共同绘制出科技发展的宏伟蓝图。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:是的,我们也将“偷师”DeepSeek
新春伊始,DeepSeek 凭借其极有竞争性的价格优势和精准的算法火遍了硅谷和华尔街。与此同时,各大科技巨头也迅速行动,纷纷下场无缝接入 DeepSeek 的 R1 模型服务,以期抢占 AI 领域先机。
深度学习与Python
2025/02/03
1970
微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:是的,我们也将“偷师”DeepSeek
服软了?爆料英伟达联手DeepSeek推出NIM服务
北京时间1月31日,英伟达正式宣布在其官网上发布了基于DeepSeek R1 671b模型的“英伟达NIM微服务”预览版,并高调宣称DeepSeek-R1的推理能力处于“最先进”水平。
用户11203141
2025/03/06
610
服软了?爆料英伟达联手DeepSeek推出NIM服务
什么是检索增强生成(又名 RAG-Retrieval-Augmented Generation)及相关引用文档
检索增强生成是一种利用来自特定相关数据源的信息来增强生成式 AI 模型的准确性和可靠性的技术。
晓兵
2025/03/23
1670
什么是检索增强生成(又名 RAG-Retrieval-Augmented Generation)及相关引用文档
刚刚,老黄携GB300震撼登场!DeepSeek推理暴涨40倍加速全球最快,26年Rubin问世
更令人瞩目的是,DeepSeek R1推动的推理时Scaling,让Scaling Law出现了全新的发展路线。
新智元
2025/03/20
650
刚刚,老黄携GB300震撼登场!DeepSeek推理暴涨40倍加速全球最快,26年Rubin问世
DeepSeek霸榜一周:奥特曼终于承认在开源问题上处于“历史错误的一边”;迅雷斥资5亿收购“直男社区”虎扑 | Q资讯
DeepSeek-R1 霸榜一周:性能、价格与开源三重冲击;网传梁文锋回应冯骥国运论;阿里巴巴发布 AI 模型,声称超越 DeepSeek;马斯克掀起“硬核裁员”风暴:百万雇员面临“自愿离职”抉择;谷歌为 Pixel、Android 部门员工提供“自愿离职”机会;迅雷将以 5 亿元收购“直男社区”虎扑,曾最高估值达 77 亿元;Linux 基金会发布指南应对 OFAC 制裁挑战;谷歌开源 PebbleOS 操作系统......
深度学习与Python
2025/02/03
1620
DeepSeek霸榜一周:奥特曼终于承认在开源问题上处于“历史错误的一边”;迅雷斥资5亿收购“直男社区”虎扑 | Q资讯
对DeepSeek事件的复盘和展望
作者简介:腾讯云TVP、北京交通大学计算机学院教授、计算机科学系主任、交通大数据与人工智能教育部重点实验室副主任。主要研究方向为多模态计算、网络数据挖掘、可信与对齐、AI Agent等。曾获中科院院长特别奖、ACM中国新星奖,作为负责人先后承担相关方向的国家自然科学基金重点项目、(首批)新一代人工智能重大项目课题、北京市杰出青年基金和国家级青年人才计划,第一/二作者论文7次获得中国计算机学会推荐国际会议的主会论文奖项,以第二完成人获得中国电子学会自然科学一等奖和北京市科学技术奖。
TVP官方团队
2025/02/03
1.1K0
对DeepSeek事件的复盘和展望
英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
时隔两年,英伟达官宣新一代Blackwell架构,为AI带来30倍推理加速。定位直指“新工业革命的引擎” 。
量子位
2024/03/20
1670
英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。
机器之心
2025/02/25
1650
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
网上关于DeepSeek的说法,哪些是错误的?
这是个流传很广的说法,意指DeepSeek通过绕过CUDA,彻底摆脱了NVIDIA的依赖。
小白学视觉
2025/02/10
1510
网上关于DeepSeek的说法,哪些是错误的?
揭秘 NVIDIA Dynamo:分布式AI推理的高效引擎
随着生成式AI模型规模的爆炸式增长,企业面临推理成本激增、分布式部署复杂度高、资源利用率低等挑战。传统推理框架在跨多节点扩展时,常因KV缓存重复计算、GPU负载不均、通信延迟等问题导致性能瓶颈。NVIDIA Dynamo作为新一代开源推理框架,专为大规模分布式环境设计,通过解耦式服务、智能路由、动态资源调度等创新技术,将推理吞吐量提升30倍以上。本文将深入解析其核心架构、技术优势及实际应用场景,帮助开发者高效部署生成式AI模型,降低推理成本并释放GPU潜能。
数据存储前沿技术
2025/03/29
5980
揭秘 NVIDIA Dynamo:分布式AI推理的高效引擎
DeepSeek爆了,问问它《哪吒2》今年为啥爆火
最近,国产大模型 DeepSeek 因其惊人的文本生成以及推理能力(深度思考)在 AI 界刷屏,并且《哪吒 2》也勇夺国产电影票房冠军。
wayn
2025/02/08
1640
DeepSeek爆了,问问它《哪吒2》今年为啥爆火
NVIDIA AI应用平台NIM开发人员指南
英伟达 NIM 通过提供灵活的微服务套件,为 AI 推理提供了一个强大、可扩展且安全的平台。
云云众生s
2024/08/16
3490
NVIDIA AI应用平台NIM开发人员指南
AI届的拼多多登临iOS榜,DeepSeek到底是什么来头?
DeepSeek的App目前已经登陆iOS免费榜前十,并超过了Google Gemini和微软的Copilot等同类竞品,可谓异军突起。
AntDream
2025/02/04
2120
AI届的拼多多登临iOS榜,DeepSeek到底是什么来头?
DeepSeek遭暴力破解,攻击IP均来自美国!
今天是大年初一,鱼皮祝大家在新的一年里阖家幸福,天天暴富! 接下来我们进入正题,说一说DeepSeek的最新情况。 DeepSeek可以说是近期最耀眼的新星
程序员鱼皮
2025/02/04
5830
DeepSeek遭暴力破解,攻击IP均来自美国!
DeepSeek 全面分析报告
DeepSeek 是一款由中国人工智能初创公司 DeepSeek 开发的大型语言模型 (LLM),于 2025 年 1 月发布,迅速成为全球人工智能领域的一匹黑马。DeepSeek 不仅在性能上可与 OpenAI、Google 等巨头的模型相媲美,而且其训练成本和运行效率都显著优于竞争对手,引发了业界和市场的广泛关注。本报告将对 DeepSeek 进行全面分析,涵盖其公司概况、产品服务、技术优势、竞争格局、商业模式、财务状况以及未来发展前景等方面。
@小森
2025/02/23
4360
DeepSeek 全面分析报告
关于Grok3和DeepSeek背后苦涩教训引发的思考
Ilya Sutskever(前 OpenAI 联合创始人兼首席科学家)曾在在召开的 NeurIPS 会议上表示,大模型的预训练已经走到了尽头。 而 Noam Brown(OpenAI 研究员,曾带领团队开发出在德州扑克中战胜职业选手的 AI 系统 Pluribus)在关于 OpenAI O1 发布的采访中提到,提升 Test-Time Compute 是提升大模型答案质量的关键。2024 年的圣诞节前夕,一片节日气氛下,湾区的硅谷 AI 大佬、机构和投资者们正在深入探讨从 “Scaling Learning” 向 “Scaling Search” 转变的路径。而这一切的思考,都可以追溯到 Rich Sutton(强化学习领域的奠基人之一)在 2019 年发表的经典短文 The Bitter Lesson (苦涩的教训)。
致Great
2025/02/24
1580
关于Grok3和DeepSeek背后苦涩教训引发的思考
开发者:为NVIDIA基于NIM的AI应用商店做好准备
NIM(NVIDIA 推理微服务)是一个虚拟化容器,用于提供 AI 功能;该技术将为 NVIDIA AI 应用商店提供支持。
云云众生s
2024/06/13
1260
60页PPT全解:DeepSeek系列论文技术要点整理
经过断断续续的整理,终于把DeepSeek系列论文的核心知识点汇总PPT完成差不多可以和大家分享了。虽然现在发布实在太晚,已经有铺天盖地的对deepseek技术解读文章和分享,但我依然希望将自己对DeepSeek V1到DeepSeek R1的理解与总结呈现给大家。
languageX
2025/03/15
1.3K0
60页PPT全解:DeepSeek系列论文技术要点整理
DeepSeek大讨论:中国AI在成本、真实训练成本和封闭模型利润率影响方面的领导地位
在过去一周里,DeepSeek 成为全球唯一的话题。目前,DeepSeek 的日流量已经远远超过 Claude、Perplexity 甚至 Gemini。但对行业观察者来说,这并非“新”闻。我们已经讨论 DeepSeek 数月之久。这家公司并不新。SemiAnalysis 一直认为 DeepSeek 极具天赋,但公众此前并不关心。
用户11468091
2025/02/05
7480
DeepSeek大讨论:中国AI在成本、真实训练成本和封闭模型利润率影响方面的领导地位
0 帧起步,腾讯云 TI 平台 5 分钟 私有化 DeepSeek
新年本应该祝福满屏的朋友圈,忽然间被 Deepseek 刷屏,这款被《黑神话:悟空》的制作人冯骥的评述:“DeepSeek可能是国运级别的科技成果。至今已在160多个国家的应用商店屠榜。
不惑
2025/02/05
7290
0 帧起步,腾讯云 TI 平台 5 分钟 私有化 DeepSeek
推荐阅读
相关推荐
微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:是的,我们也将“偷师”DeepSeek
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档