部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >60页PPT全解:DeepSeek系列论文技术要点整理

60页PPT全解:DeepSeek系列论文技术要点整理

原创
作者头像
languageX
修改于 2025-03-16 00:07:19
修改于 2025-03-16 00:07:19
2.6K0
举报
文章被收录于专栏:大语言模型大语言模型

DeepSeek-R1,让所有AI相关从业者,从年初卷到现在...

经过断断续续的整理,终于把DeepSeek系列论文的核心知识点汇总PPT完成差不多可以和大家分享了。虽然现在发布实在太晚,已经有铺天盖地的对deepseek技术解读文章和分享,但我依然希望将自己对DeepSeek V1到DeepSeek R1的理解与总结呈现给大家。

虽迟但到,希望这60页PPT对大家有所帮助。

MLA

MHA

GQA

MLA

MOE

MoEs和Transformer

GShard

Mixtral 8x7B

DeepSeekMoE

MTP

Blockwise Parallel Decoding

Better & Faster Large Language Models via MTP

DeepSeekV3-MTP

DualPipe

pipline parallel 流水线并行

Tensor parallel 张量并行

Expert parallel 专家并行

DualPipe 管道并行

FP8混合训练

GRPO

DeepSeek R1

参考:https://zhuanlan.zhihu.com/p/20844750193

DeepSeek-R1-Zero

DeepSeek-R1

DeepSeek-R1-Distill

在年初发布的DeepSeekR1,开源了671B的满血版以及一系列蒸馏模型后,很多企业开始紧锣密鼓的购买算力,私有化部署模型,在应用中接入ds,研究ds可以带来的价值;算法团队还要疯狂的学习以上技术点。

还没反应过来,不等大家休息,DeepSeek又来了开源周(2月24日至2月28日),开源6个核心技术项目,涵盖了从硬件优化到数据存储的全链路过程:

1.FlashMLA(2月24日):

  • 技术定位:针对NVIDIA Hopper GPU优化的多头潜在注意力(MLA)解码内核,专为处理可变长度序列设计。
  • 核心创新点
    • 动态资源分配,按序列长度分配算力。
    • 分页KV缓存,显存占用减少至1/4。
    • 低秩分解技术,支持边缘部署。
  • 性能亮点:算力峰值达580 TFLOPS,内存带宽3000 GB/s,延迟降低。

2.DeepEP(2月25日):

  • 技术定位:首个专为MoE(混合专家模型)设计的开源通信库,优化分布式训练与推理。
  • 核心创新点
    • 支持NVLink和RDMA硬件级优化。
    • FP8智能压缩,减少带宽需求。
    • 通信-计算重叠,基于钩子式方法。
  • 性能亮点:MoE模型训练性能提升,千亿模型训练成本降低。

3.DeepGEMM(2月26日):

  • 技术定位:面向Hopper GPU的高效FP8矩阵计算库,支持稠密模型和MoE模型的GEMM运算。
  • 核心创新点
    • Tensor Core深度适配,实现1350+ FP8 TFLOPS。
    • 显存优化,FP8精度下显存占用为FP16的1/4。
    • 通用性接口设计,兼容Transformer和MoE模型。
  • 性能亮点:算力利用率提升,训练迭代速度加快。

4.DualPipe和EPLB(2月27日):

  • DualPipe
    • 技术定位:双向管道并行算法,专为DeepSeek-V3/R1模型设计。
    • 核心创新点:双向计算-通信重叠,流水线气泡压缩,共享梯度传输。
    • 性能亮点:训练速度提升,硬件利用率提升。
  • EPLB
    • 技术定位:面向MoE模型的动态负载均衡工具。
    • 核心创新点:动态冗余专家分配,分层与全局负载均衡。
    • 性能亮点:节点间通信流量减少,训练成本降低。

5.Fire-Flyer File System (3FS)(2月28日):

  • 技术定位:AI专用分布式文件系统,优化数据密集型任务吞吐。
  • 核心创新点
    • 分解式架构,CRAQ协议强一致性。
    • 全局存储共享,支持KVCache显存优化。
  • 性能亮点:180节点集群聚合读取吞吐6.6 TiB/s,GraySort测试3.66 TiB/min。

6.Smallpond(2月28日):

  • 技术定位:基于3FS的轻量级PB级数据处理框架。
  • 核心创新点
    • DuckDB集成列式存储与向量化计算。
    • 弹性扩展,支持从单机到分布式集群。
  • 性能亮点:两阶段分区排序策略,PB级数据处理效率提升。

刚刚部署完的模型,又要学习新技术,看如何将这些加速工程技术点应用到推理框架节约算力成本。虽然DeepSeekR1的激活参数少,但是原模型占用空间大,而且以上工程优化技术未应用到推理框架,实际的推理成本是很高的。

最后聊聊腾讯混元和ima,确实好用至少用这么久就只出现了一次服务器繁忙,而且今天体验发现他已经有了自己的T1模型,速度比R1快不少,不知道是模型规模小还是背后算力分配多,希望T1也能出技术报告~哈哈

最后最后,个人或者企业在实际落地场景其实不用一味追求T1和R1(尤其是满血版),可以从需求复杂度,算力成本,实际效果,回复响应来选择最适合自己的大模型~

参考:

除了论文,参考很多大佬的技术博客也很多,当时没有记录链接,都是从ima来的...

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
fNIRS数据处理工具包Homer2的数据转换教程
前期我们公众号推送了《fNIRS数据处理工具包Homer2下载与安装的详细教程》,对Homer2的下载与安装进行了详细介绍。不过需要注意的是在使用工具包Homer2进行数据处理前,需要将原始数据转换成Homer2所要求的数据格式。这是因为fNIRS厂家众多,各个厂家的设备具有特定数据存储格式,而因此Homer2能够读取的数据格式是特定的。本文我们将以NIRx原始数据为例,和大家分享下Homer2数据格式的转换方法,希望能帮助大家更好地学习该工具包的使用方法。
悦影科技
2022/09/05
7920
值得收藏!fNIRS功能近红外数据处理工具包盘点(全网最全)
可以说是做fNIRS激活分析必用的一款开源工具包,该工具包由韩国KAIST的生物成像信号处理 (BISP) 实验室开发。NIRS_SPM基于SPM工具包和Matlab平台,可以识别目前主流fNIRS厂商设备采集的数据格式,它基于一般线性模型GLM对fNIRS进行激活分析和统计(一阶分析和组分析)。此外,NIRS_SPM还具有对数据的简单预处理(比如说滤波等)、通道的定位(如输出每个通道的MNI坐标等)、ROI分析、时间序列分析等功能,如图1。
悦影科技
2022/05/04
2.4K0
新手必看!EEGLAB工具包下载、安装及数据导入教程
EEGLAB是一款免费、开源的且应用最广泛EEG数据处理和分析工具包,本文详细介绍EEGLAB工具包的下载、安装及数据导入步骤,希望对大家有用。
悦影科技
2020/11/13
4.7K0
新手必看!EEGLAB工具包下载、安装及数据导入教程
EEG信号处理与分析常用工具包介绍
在脑科学领域,EEG技术可以说是研究大脑的最重要的技术手段之一,而对于采集得到的EEG信号需要经过较为复杂的多个步骤的分析和处理才能够获得我们所需要的最终结果。EEG信号的分析和处理可能会涉及以下一个或多个方面:信号的预处理(预处理也需要多个步骤)、ERP时域分析、时频分析、信号的功率谱计算、功能连接、溯源分析等等。上述涉及到的EEG信号分析方法对于有编程基础和学过“数字信号处理”相关课程的人来说或许会稍感轻松,但是对于没有学过 “数字信号处理”相关课程的人来说可能就会困难重重。幸运的是,目前国内外研究者开发出了多款EEG信号处理和分析的开源工具包,供大家免费下载使用。这些开源的EEG工具包促进了脑科学领域的蓬勃发展,也使得“技术小白们”经过简单的学习就可以运用那些高大上的EEG分析技术。这里,笔者就对这些常用的EEG信号分析与处理工具包进行简单的介绍。
悦影科技
2020/12/16
1.6K0
EEG信号处理与分析常用工具包介绍
matlab2016a下载包及安装教程
链接:https://pan.baidu.com/s/1wMGK5jYxYdqs1IxRDfJl8A 提取码:y72e 复制这段内容后打开百度网盘手机App,操作更方便哦
全栈程序员站长
2022/09/01
2.7K0
支持向量机SVM工具包LIBSVM的安装和测试
目前,机器学习已广泛地应用于脑科学领域的研究中,特别是在利用脑影像数据进行疾病的诊断方面,离不开分类算法。支持向量机(Support Vector Machine, SVM)作为一种有监督学习的二元分类器,在小样本分类中具有突出的优势,因此非常适合于基于脑影像数据的疾病分类研究。LIBSVM工具包是台湾大学Lin Chih-Jen教授等开发一个SVM工具包,其可运行于Python, R, MATLAB等语言环境下,是目前大家用的比较多的一个SVM工具包。本文,笔者详细阐述Matlab环境下LIBSVM的安装和使用教程,希望对大家的研究有所帮助。
悦影科技
2020/12/16
1.4K0
支持向量机SVM工具包LIBSVM的安装和测试
EEG/MEG数据处理工具包Brainstorm的下载与安装教程
Brainstorm是由麦吉尔大学(McGill University)的McConnell Brain Imaging Centre,南加州大学(University of Southern California)的Signal & Image Processing Institute,Cleveland Clinic Neurological Institute等多家单位联合开发的一款基于Matlab的开源工具包,可用于分析EEG、MEG等信号。与FieldTrip工具包有点类似,除了包含基本常用的EEG分析技术外,Brianstorm最主要的优势是可以进行基于多种技术的溯源分析。此外,与FieldTrip相比,Brianstorm具有GUI界面,方便没有编程基础的研究者使用。
悦影科技
2020/11/13
1.7K0
EEG/MEG数据处理工具包Brainstorm的下载与安装教程
[深度学习工具]·音频特征提取pyAudioAnalysis工具包
链接:http://www.cnblogs.com/xingshansi/p/6806637.html
小宋是呢
2019/06/27
2.7K0
[深度学习工具]·音频特征提取pyAudioAnalysis工具包
Light Field 光场以及Matlab光场工具包(LightField ToolBox)的使用说明
我在这篇文章里详细介绍了光场数据的处理过程,如果你是研究光场领域的新手,这篇文章对你来说应该是非常有用的。声明一下:一切理解都是本人观点,如有疑问,还望在评论中留言。如需转载请与本人联系,谢谢合作!
好好学SLAM
2021/05/28
2.9K0
最新MATLAB下载安装教程(附文件)
MATLAB(矩阵实验室)是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。
糯米导航
2022/07/19
5K0
最新MATLAB下载安装教程(附文件)
Psychtoolbox刺激呈现工具包的安装及下载
Psychtoolbox工具包是一款基于Maltab或Octave平台的用于视听觉刺激呈现的系统,与E-Prime刺激呈现软件一样,其主要应用于神经科学、脑科学、认知神经科学和心理学等领域,可与EEG和fMRI技术相结合,研究被试特定任务下的EEG和fMRI信号的变化特性。与商业软件E-Prime不同,Psychtoolbox工具包完全免费,通过Matlab编程可实现灵活的实验设计。但其唯一的缺点是没有GUI界面,需要研究者自己进行Matlab编程并调用工具包中的编写好的函数。但是,对于有一定编程基础的研究者来说,Psychtoolbox工具包还是很容易上手的。本文主要介绍Psychtoolbox工具包的安装方法以及工具包如何下载。
悦影科技
2020/11/28
1.8K0
MATLAB R2022b 安装教程(2024年图文保姆级教程)
Matlab是一个由MathWorks公司开发的高性能语言和交互式环境,主要用于技术计算。它被广泛应用于工程计算、数据分析、算法开发以及模型构建等领域。以下是Matlab的一些关键特点:
程序员洲洲
2024/07/20
1.8K0
MATLAB R2022b 安装教程(2024年图文保姆级教程)
BR2022下载安装包 br中文版一分钟安装教程各版本安装包-经验分享
BR是 Bridge 缩写,Adobe Bridge 是Adobe公司开发的一个组织工具程序,定义就是数字资产管理软件和照片管理工具。可以使用 Bridge创建管理使用Adobe所有软件创建任何格式的文件。以及查看有关从相机导入的数据,如照片按尺寸、相机型号、镜头类型、曝光时间等方面。
木子学Lee
2023/03/03
8070
BR2022下载安装包 br中文版一分钟安装教程各版本安装包-经验分享
matlab最新保姆级安装教程【博主亲测】
R2020b的安装包大小在22GB,里面包含了多个压缩包,下载时间可能需要多一点,耐心让它飞一会吧:
糯米导航
2023/01/03
3.4K0
matlab最新保姆级安装教程【博主亲测】
ERPLAB中文教程:ERPLAB安装与添加通道
ERPLAB是免费开源的Matlab软件包,用于分析ERP等脑电数据。ERPLAB扩展了EEGLAB的功能,为ERP的处理、分析和可视化提供非常棒的工具。不管你是初学者还是高级用户,ERPLAB都非常的好用。对于初学者来说的图形用户界面易于学习,而Matlab脚本为中级和高级用户提供了强大的功能。
脑机接口社区
2020/07/01
2.2K0
Matlab R2020a软件下载安装激活教程啦!
MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。
知识兔下载
2023/03/10
1.9K0
Fuzor2020安装教程
1.先使用“百度网盘客户端”下载Fur20_CN_x64安装包到电脑磁盘里,并鼠标右击进行解压缩,安装前先断网电脑网络,然后找到“第1步:安装Fuzor-2020.msi”,鼠标右击选择【安装】
糯米导航
2022/10/06
1.2K0
Fuzor2020安装教程
cdr2023全新版下载安装教程CorelDRAW2023
coreldraw是一款深受设计师们喜爱的制图软件,它能够帮助设计师绘制出许多精美的图案。作为一个强大的绘图软件,它被喜爱的程度可用事实说明:用作商业设计和美术设计的PC机几乎都安装了 。CorelDRAW让您轻松应对创意图形设计项目。
用户7442547
2022/11/05
3.4K2
详尽!Ubuntu16.04LTS安装Matlab2016b!(2018.4重编版)
前言 之前在网上也看了很多文章, 大多数都是图片少得可怜, 排版不够清晰, 所以血泪安装了几波之后, 写这篇分享给大家. 然后也算做Ubuntu软件推荐进击篇的第一篇文章. 多图预警!转载请注明出处!!! 重新整理和编辑了文章. ---- 下载和解压 某盘链接 密码:3cvw 这是mac, linux, win三个版本的链接 下载之后有一个rar压缩包和两个iso, 我们解压rar rar x Matlab\ 2016b\ Linux64\ Crack.rar 之后我们给一下终端截图, 和加
sean_yang
2018/09/04
7840
详尽!Ubuntu16.04LTS安装Matlab2016b!(2018.4重编版)
Matlab R2018a 64位安装教程
最近几天捣鼓Matlab的安装,折腾了好久,终于解决了。现将Matlab R2018a 64位的安装流程梳理总结如下。
3D视觉工坊
2020/12/11
1.3K0
Matlab R2018a 64位安装教程
推荐阅读
相关推荐
fNIRS数据处理工具包Homer2的数据转换教程
更多 >
LV.7
河南悦影医药科技有限公司总经理
目录
  • MLA
    • MHA
    • GQA
    • MLA
  • MOE
    • MoEs和Transformer
    • GShard
    • Mixtral 8x7B
    • DeepSeekMoE
  • MTP
    • Blockwise Parallel Decoding
    • Better & Faster Large Language Models via MTP
    • DeepSeekV3-MTP
  • DualPipe
    • pipline parallel 流水线并行
    • Tensor parallel 张量并行
    • Expert parallel 专家并行
    • DualPipe 管道并行
  • FP8混合训练
  • GRPO
  • DeepSeek R1
    • DeepSeek-R1-Zero
    • DeepSeek-R1
    • DeepSeek-R1-Distill
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档