首页
学习
活动
专区
圈层
工具
发布

#gpu

国产GPU选型实践与TCE智算解决方案:性能、生态与成本优化路径

IT资讯研究所

腾讯科技 | 研究员 (已认证)

本文分析国产GPU选型中面临性能、生态与成本三重瓶颈,提出腾讯TCE智算解决方案。该方案通过分场景GPU推荐、全场景性能评测、生态兼容支持(含CUDA兼容派与自...

17810

国产GPU实现关键场景性能突破,腾讯云TCE智算提供全栈解决方案

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

应对算力瓶颈与生态迁移挑战 AI大模型训练与推理面临严峻算力需求与供应链风险。传统方案依赖国际厂商GPU,存在供应不稳定、成本高昂及合规风险。企业面临核心痛点:...

16210

驱动 AI 出海双轮引擎:基于 Serverless GPU 与全球调度的算力与合规架构

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

针对AI出海面临的高延迟、潮汐流量算力瓶颈及

10710

马斯克20万GPU训出史上最聪明AI,Grok4重返地球之巅!人类博士全线溃败

OpenCV学堂

现在,SuperGrok的用户已经可以用上了,普通版月费30刀,Heavy版月费300刀。

13600

AI编程里程碑!谷歌AI自己写代码惊呆工程师,GPU内核算法反超人类21%

OpenCV学堂

在5月中旬,谷歌扔出的这个炸弹(号称是数学界AlphaGo的「第37步」时刻),就在不断冲击人们的认知——AI,已经拥有了自我进化能力!

18800

图像编辑器 Monica 之生成漫画风格的图像、以及使用 GPU 实现推理

OpenCV学堂

Monica 目前还处于开发阶段,当前版本的可以参见 github 地址: https://github.com/fengzhizi715/Monica

9500

国产GPU全景选型与量化实践:打通大模型训推的性能与生态瓶颈

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

本文聚焦大模型训推面临的算力、访存带宽及生态迁移瓶颈,提出基于“一云多芯”的国产GPU精细化选型矩阵(涵盖GPGPU与DSA架构)。通过覆盖真实业务场景的严格量...

18410

Kubernetes GPU 调度完全指南:从入门到生产实践

云技术以及云存储

在 AI 大模型训练、推理场景爆发式增长的今天,如何在 Kubernetes 集群中高效调度 GPU 资源,已成为云原生领域的关键技术。本文系统梳理 K8s...

26710

明明模型很小,为啥 GPU 显存却被吃满?一文讲透深度学习显存真相

GPUS Lady

这个话题十分有趣,Jimin Lee的文章就详细解释了这一困惑,我们来看看他是怎么说的。

19510

黄仁勋炸场 GTC 2026:NemoClaw 才是真正大招,比新 GPU 更关键

GPUS Lady

在2026年NVIDIA GTC大会上,黄仁勋带着机器狗、趣味彩蛋走完舞台,在一众硬件新品里,藏着一个对企业技术决策者远比新显卡更重要的重磅发布:NemoCla...

21610

GPU 黑科技 DSMEM: 让线程块 “片上直达”,告别显存绕路

GPUS Lady

我们可以把 GPU 里的 ** 线程块(Block)** 想象成一个个独立的 “小工作组”,它们并行干活,效率极高。但只要涉及 “跨组传数据”,老架构(Hopp...

7510

GPU地球进展

气象学家

先用LINE_STRIP实现了省界,一条线一个VAO在for循环里逐个渲染,目测对帧率没什么影响。GPU让我有些时候低估了CPU的效率。

5410

显存大解放:vLLM Sleep模式实战指南,90% GPU资源瞬间回收!

Michael阿明

参考 https://docs.vllm.ai/en/latest/features/sleep_mode/

17510

手把手教你使用 Docker+GPUStack 快速搭建企业级大模型服务平台,轻松实现从单机到集群的高效扩展!

民工哥

手把手教你使用 Docker+GPUStack 快速搭建企业级大模型服务平台,轻松实现从单机到集群的高效扩展!

39810

50:高端计算威胁解析:GPU集群破解经典加密的风险与防御

安全风信子

作者: HOS(安全风信子) 日期: 2024-09-13 主要来源平台: GitHub 摘要: 本文深入解析GPU集群破解经典加密的技术原理,从并行计算...

11710

传SK海力士推迟HBM4量产与扩产时间

芯智讯

12月8日消息,据韩国媒体ZDNet Korea 报导,存储芯片大厂SK海力士已经修改HBM4生产计划,原本2026年2月量产HBM4、明年二季度扩大产量的计划...

23510

不惧谷歌TPU竞争!黄仁勋:GPU有通用优势,英伟达地位稳固!

芯智讯

11月28日消息,近日业内盛传美国科技巨头Meta可能会从2027年起采用谷歌自研的TPU芯片来用于满足自身的AI需求。如果接下来有更多的厂商选择谷歌的TPU,...

9810

传英伟达因DRAM短缺已停止向GPU主板合作伙伴提供显存

芯智讯

11月27日消息,业内传闻显示,由于DRAM内存芯片供应紧缺、价格持续上涨,英伟达已经停止向GPU板卡合作伙伴出售GPU捆绑的显存,导致合作伙伴自行采购所需的显...

13510

2025年第三季数据中心GPU出货量暴涨145%,PC显卡仅增长2.5%

芯智讯

11月25日消息,根据市场研究机构 Jon Peddie Associates 的最新报告,2025年第三季PC 显卡出货量环比增长了2.5%,但数据中心的GP...

14710

国产GPU双雄科创板IPO又进一步!

芯智讯

11月13日,国产GPU厂商摩尔线程正式发布科创板上市招股意向书,其网下申购代码688795、网上申购代码 787795,拟发行7000万股,占发行后总股本 1...

18610
领券