00:00
爸爸爸哈,大家好,周米又回来了,今天呢我们来到了寒武纪科技里面去洞察一下寒武纪的m Lu第三代芯片的整体的架构,今天呢主要是讲架构的细节,那现在我们从头的去回顾一下我们整个系列,我们从AI的计算体系开始讲起,到AI芯片的基础,从CPUGPU到现在的MPU,打开MPU之后呢,我们会有华为特的M,谷歌的T,特斯拉的系列,现在来到了国内外的一些其他的芯片厂商,那其实呢,主要是集中在国内的其他芯片厂商去看了B焰随缘,还有寒武纪它的产品形态,芯片的剖析的架构,今天我们主要是来到了寒武纪MUMU03芯片架构的这个体系,不过呢有一点我想澄清的,因为有很多朋友呢告诉我在这里面呢吐槽。
01:00
在这里面呢,我想澄清的一点就是这一个系列呢,不是为了吐槽友商而吐槽友商呢,我们是希望能够通过友商国内的实际的产品去深入理解AI芯片相关的技术,看一下国内的一些大厂和初创企业都是怎么做AI芯片的,接着第二个点就是洞察不同厂商的芯片的架构,我们要打开里面的细节,从而去思考AI芯片的未来的发展方向。诶现在我们来到了第一个内容躯看寒武器的整体的架构的发展,那首先呢,寒武器的架构呢,实际上是经历了五代了,下面只有一个三个图案,首先第一代就是5G的MU00,从第零代开始呢,那个时候呢,只是MYIP在华为麒麟的980和970上面,接着呢有了第一代啊,它真正第一代的就是多核的架构,MO01里面推出了,接着是第二代,第二代里面呢就提出。
02:00
的一个重要的思想就是多核共享片类的存储,这款芯片的寒武纪的产品的形态是最丰富的,有思源二零,270和290,到了第三代架构呢,就是寒武纪的四元的370,这里面呢用了多克新力那去组成的,至于什么叫做多克新力呢?其实我在前面的边科技里面的一章节给大家去汇报过,然后呢还漏了一袋啊。另外一代就是寒武纪的MUU05,那现在呢,具体的细节是没有披露出来的,我们能找到的,或者现在能获取的就是最新的第三代,下面呢,我们以航武器的MOU02,也就是它的第三代架构来去看一下整体的架构的区别,首先呢,我们可以看到它有三款的产品形态,一款是MUMU20 270,还有290,其实呢,都是同一代架构,但是呢,同一架架构里面的很大不一样,就是里面的Mo的核数不一样啊,这里面我们可以看到了,里面最重要的一点就是共享我们的L2的share memory共享了其中。
03:00
一个缓存,那这里面可以四个扩呢围绕在一起,四个扩围绕在一起,外围呢接入了DDR,我们可以简单理解为这块芯片呢,就是一张卡呢,一张卡呢,卡跟卡之间呢,走的是第三代的PCI1,在更加丰富的产品形态里面呢,或者在一个真正的训练的场景里面呢,用的显存呢,就是h b hi ban wi memory,另外呢,卡跟卡之间呢,除了可以走PCI之外呢,还可以走m Lu link,那这个呢,就是韩武g m lu02的产品的整体的架构或者逻辑图,现在我们看一下了,新腻的封装呢,可能有点不一样啊,现在呢主要是看三个,第一个呢是思源的220,它里面呢就是一块芯片了,一块芯片对外提供一个P313项的32GB每秒的带宽,中间这个就是思源290,旁边呢很有意思的就有四个HB,每个呢是16GB,对外呢是通过m link总带宽提供100B。
04:00
零秒的一个卡跟卡之间的互年的方式,接着呢是m luu370,它最新的一款产品啊,应该是上一代最新呢,从210的时候,现在已经二三年了,然后它把两克新力封装在一起,上面呢是一个新力,下面呢是一个新力,全局呢有央ma的内存访问,然后能够做到我们的低功耗,低时延和高带宽,那高带宽主要是指MOU跟U之间的带宽量非常非常高,但很可惜的就是它没有做MOU link,其也就是没有做整机的服务的形态,最后只能做出一款呃,类似于英伟达的4090这种插槽的板卡,接下来我们以航为机,最新一代的产品呢,M luu370,那我们可以看到嘞,芯片跟芯片之间呢,两块芯片连在一起呢,是通过我们的板卡,就是呃,那块主板里面呢,就内置了m link bridge这一个内容,然后让我们的芯片跟芯片之间进行互联,而芯片呢,跟芯片之间另外一种互联方式。
05:00
正呢走的是PCI,芯片跟CPU之间呢走的是pcie,所以我们可以看到PCI无处不在,这里面呢就用了PCI Switch进行一个互联互通的,下面呢我们根据这个图继续打开我们的370的产品形态,那刚才讲到了这里面虽然有两块蓝色,那两块蓝色呢是代表我们两块新封装在一起变成一块芯片,那芯片里面呢,带了一个DDR的内存,DDR便宜嘛,H非常的昂贵啊啊,这里面就要看它整体的性价比了,它里面呢就提供了多种的连接方式,卡跟卡之间呢,可以通过一个互联,直接互联呢,可以看到它有一条线,另外呢,卡跟另外一个比较远一点的卡之间呢,走的是m muu link bridge MU link的一个桥来进行一个连接,一个U型柜的一个半个桌子,那么大呢,就可以插八块我们的370的一个显卡,那接着呢,第二个内容我。
06:00
我们一起去看看m luu03的整体的架构,下面才正式的来到我们的整体的架构,右边的,右边的这个模块滑滑绿绿的是我画的,嘿,不呃,有点丑,但是呢,这个叫做MO03的整体的casta里面呢就有非常多不同的子拈了,我们先拿来看看有哪几个子模块啊,第一个呢,就是IPU,那可以看到这里面有四个IPU,上面有两个,下面有两个,中间有个模块叫做MPU,那可以看到四块IPU中间加一个MPU,最后这整个形态呢,叫做cost,那我们现在逐个的去打开,首先呢,IPU呢,这个I叫做intellIgEnt process unit,也就是我们的智能的PU或者AI处理的最核心的芯片,那这里面呢,作为整个MOU03的核心的模块,负责AI的应用的计算和存,还有一些简单的指令的控制和。
07:00
执行,那我们后面会详细的打开IPU里面的每一个模块,特别是嗯,T function unit,还有v function unit,接着呢,我们看看中间的这个模块叫做MPU,那这个M呢,叫做memory啊,主要是负责我们的内存的MU中间里面最大的一个模块shared memory shared RA,主要是对我们AI的数据,对我们应用的数据进行处理的,那接着第三个内容就是整个Costa m03呢,这整一个架构里面呢,就有四个IPU,一个m Lu协作构成一个A,那这里面呢,多个Costa就可以组成不同的产品形态,所以MU03呢,虽然现在只有四元370,但实际上呢,它可以通过多个cast的组合,从而有不同的芯片的产品形态去做推理或者训练啊这些把它区分起来,诶我看今天的时间。
08:00
差不多了,我们下一节呢,再继续打开每一块的内容,现在综米会把所有的视频呢,一对一的全部都展开在这里面,每个视频都有详细的介绍哦,欢迎打开和吐槽,给我一键三连给我一键三连啊,谢谢各位,拜了个拜。
我来说两句