12月11日,AI芯片创企燧原科技在上海举办首场发布会。此次发布会上,燧原科技推出了首款云端AI训练芯片邃思DTU,以及搭载该芯片的AI加速卡云燧T10。据燧原科技表示,云燧T10已经可以实现量产,并预计2020年第一季度上市。至此,这家由腾讯投资,且成立至今不到两年的“年轻”公司,迈进了AI芯片市场的竞争赛道。
邃思DTU是本次燧原科技发布会的主角,将主要应用于云端人工智能训练,支持CNN、RNN、LSTM、BERT等网络模型以及FP32、FP16、BF16、Int8、Int16、Int32等数据类型。
邃思DTU基于通用AI处理器的设计,具备一定的可编程性,其计算核心拥有32个通用独立自主设计的可扩展神经元处理器(SIP),每8个SIP可以组合成1个可扩展智能计算群(SIC)。
据燧原科技介绍,邃思DTU由12nm FinFET工艺打造,集成了141亿个晶体管,采用2.5D封装,具有16Gbps的PCIe 4.0接口和25Gbps的ESL高速互联。
云燧T10和云燧T11是此次发布会的另一亮点,而且燧原科技表示,云燧T10已经可以实现量产,预计2020年第一季度上市。
据了解,云燧T10是一款面向云端数据中心的AI训练加速卡,双槽位标卡,支持PCIe 4.0。单卡单精度(FP32)算力可达20TFLOPS,支持单精度FP32和半精度BF16的混合精度计算,最大功耗225W,这与英伟达最新Tesla V100S单精度算力 16.4TFLOPS,最大功耗250W~300w相比,具有性能上的优越性。
在发布会上,燧思科技同时推出了编程平台“驭算”,它在支持主流深度学习框架如TensorFlow、PyTorch等框架的同时,还针对邃思芯片做了特定优化。驭算可以提供完整的编译、调试、调优工具链,并且在硬件层开放了SDK,为深度开发者提供细粒度算力编程接口,降低了开发门槛。
据了解,驭算可以针对复杂模型集群训练,如BERT等,提供分布式调度系统,并在1024节点集群规模下,训练线性度加速比达到86%。
燧原科技CEO赵立东,在此次发布会上表示,“目前我们已经与腾讯针对通用人工智能应用场景的项目开展密切的合作,未来也将会扩展到更多AI应用场景。”
从这里或许就不难看出,BAT三巨头,对于云端AI芯片的押注开始初露端倪。
腾讯对燧原科技的投资,得到了燧思DTU的加成,百度昆仑和阿里含光800在前些日子也是出了不小的风头,尤其是这些AI芯片的应用场景同为云端加速,不得不让人去联想,BAT是否开始选择了同一条路:通过对AI芯片的押注,重点推动自家的云计算战略。
随着5G时代的到来,云端也变得更加重要,当传输足够快速,无论是训练和推理,或许都可以放在云端进行,而AI芯片的存在,无疑是为云端应用提供了强大助力,至少除了BAT三大巨头之外,华为(昇腾系列芯片)、谷歌(TPU)、AWS(第二代自研云端芯片)、微软(Graphcore IPU 商业化)等也早已开始行动。
公司介绍:
燧原科技,2018年3月成立于上海,由赵立东和张亚林联合创立,成立距今不足两年。据了解,燧原科技研发团队的主要成员拥有着15年以上的芯片及相关软件生态系统的开发及量产经验,其中燧原科技CEO赵立东曾在AMD、紫光任职,燧原科技COO张亚林也有在AMD近十年的工作经历。
领取专属 10元无门槛券
私享最新 技术干货