帅云霓的技术小屋

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

在大型的计算集群中，往往有成千上万张GPU卡。如何将这些卡构成的算力集群分配给不同的租户，执行租户各自的计算任务，并实现租户之间的资源隔离和故障隔离呢？这就是算力分配与调度系统的功能了。

大模型与AI底层技术揭秘（小结-下）

目前IT行业的首要热点，也就是所谓的“大模型”和“机器学习”等AI技术，背后的算法，本质上是列出一个参数方程，并根据现有样本(参数方程的输入和输出)，来迭代计算参数方程的参数，也就是所谓的调参。

大模型与AI底层技术揭秘（小结-上）

在上期，我们讲到，在CUDA中，可以利用GPU的通用指令（加减乘除、乘方等），通过计算麦克劳林展开式，来计算超越函数。

大模型与AI底层技术揭秘（42）蜂巢里藏着的奥秘

小H在楼下见到S和他的妈妈，S的妈妈对S说：你看，你还记得小H当初教你背圆周率吗？

大模型与AI底层技术揭秘（41）割圆术与雪糕

在计算机系统中，如果想取的数据不在缓存中，就是所谓的cache line miss，需要去内存里面找。如果数据是新的（类似新书刚出版）则一定得从内存里面找，需要忍受较长的时延。

大模型与AI底层技术揭秘（40）踩着书堆爬出坑

最近，小H工作地方食堂新增了一个窗口，卖小龙虾尾盖浇饭，在高峰时段排长队。小H在体验过几次痛苦的排队以后，决定悄摸摸地提前去吃小龙虾尾盖浇饭。

大模型与AI底层技术揭秘（39）王者荣耀与小龙虾饭

小H把这首诗读给方老师听，方老师笑了：其实你看GPU里面寄存器和其他存储子系统的组织方式，跟CPU中，存储子系统的组织方式相比，还真就很类似这首诗描述的情景呢！

大模型与AI底层技术揭秘（38）远看泰山黑乎乎

在上期，我们留下了一个问题：在warp中，多个CUDA核需要同步的时候需要怎么做呢？

大模型与AI底层技术揭秘（37）绞刑架下的报告

在GPU程序中，如果有if-else这样的分支，在一个warp中，不同的CUDA Core走到了不同的分支，此时scheduler应当如何发射后续的指令呢？

大模型与AI底层技术揭秘（36）分裂没有出路

在上期，我们讲到了图灵的故事。图灵发明的密码破译机是盟军赢得二战的得力助手，但正义的联盟战胜法西斯，最终还是依靠英雄的血肉之躯。

大模型与AI底层技术揭秘（35）身后就是莫斯科

在上期，我们提到，实现支持完备QoS的运营级别GPU虚拟化的关键在于，实现GPU任务的上下文切换。这实际上涉及到一个问题：


大模型与AI底层技术揭秘（34）最早的国际象棋程序

在上期，我们说到，益民食品厂的一名青年工程师利用自己所学的电机学的知识，在电网解体的情况下，抢修工厂供电成功。

大模型与AI底层技术揭秘（33）从蒸汽动力到电气化的跃进

上一期，小H在梦里把游戏《仙剑奇侠传》跟武侠小说混到一起并且说梦话了，被大家嘲笑了。方老师顺便嘲笑了旁边玩《和平精英》的一个家伙：

大模型与AI底层技术揭秘（32）保卫冰砖的逆向工程

上期我们说到令狐冲在思过崖了解到了剑宗与气宗的区别，武功很快就有了质的飞跃，消灭了大boss东方不败，跟任盈盈携手隐居在山清水秀的杭州，将饮酒与练剑作为日常娱乐项目，最终得道成仙。

大模型与AI底层技术揭秘（31）令狐冲化身酒剑仙

在上一期，我们讲了一个令狐冲通过使用NVidia GRID vGPU方案，把虚拟化的GPU通给多个虚拟机的方案。但是，这个方案仍然没有解决一个关键的问题——不同的GPU虚拟化实例之间的故障隔离问题。如果任何一个虚拟化实例出现故障，会导致物理GPU上，虚拟的所有GPU实例中运行的程序被全部抛出异常。


大模型与AI底层技术揭秘（30）剑宗与气宗

在上期，我们讨论了AMD主导的基于SRIOV的GPU虚拟化方案。我们也发现了，由于GPU本质上不是CPU的一个外设，而是一个高度并行，具备成千上万个核的计算机，而SRIOV只是提供了对外的PCI-E接口的虚拟化，并没有提供GPU计算核心与内存分配给不同VM的能力，因此，GPU的SRIOV虚拟化方案存在着一些固有的缺陷。

大模型与AI底层技术揭秘（28）思过崖上踢实况

在上期，小H在梦里穿越成了“发哥”，并且成功理解了什么是“时分复用”和“空分复用”。这次，小H又梦见了什么呢？

大模型与AI底层技术揭秘（26）从悲惨世界到和平精英

小H最近因为沉迷学（you）习（xi），瘦了不少，小伙伴们打算把小H带去搞点好吃的。

大模型与AI底层技术揭秘（27）食神挑战烤肥肠

有一天，小H被人拉进了一个技术交流群，却发现群里讲的都是各种八卦、社会新闻和pdf小作文。小H立即产生了浓厚的兴趣，天天在这个群里面学习知识。皇天不负有心人，有一天群里终于出现了技术话题，讨论起GPU服务器内部的组件互联。小H看见了一句金句：“计算的尽头是通信”。再一看，原来是方老师说的！

大模型与AI底层技术揭秘（25）大丈夫日记

在很久以前，有一个老爷爷，种下了一棵葫芦，变成了七个各有绝学的葫芦娃。可惜葫芦变成的七个葫芦娃为了保卫和平，救出爷爷，逐一被蛇精和蝎子精抓到了。蛇精和蝎子精想把七个葫芦娃炼成七心丹，没想到七个葫芦娃合体成为了葫芦小金刚，踢碎了炼丹炉，经过艰苦的战斗，最后打败了各路妖魔鬼怪，让山谷恢复了往日的和平。

大模型与AI底层技术揭秘（24）从葫芦娃到植物大战僵尸

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了帅云霓的技术小屋专栏，为你提供了帅云霓的技术小屋的相关文章，致力于帮助开发者快速成长与发展。

帅云霓的技术小屋

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐