腾讯科技 | 研究员 (已认证)
本文分析国产GPU选型中面临性能、生态与成本三重瓶颈,提出腾讯TCE智算解决方案。该方案通过分场景GPU推荐、全场景性能评测、生态兼容支持(含CUDA兼容派与自...
腾讯科技(深圳)有限公司 | 数据分析 (已认证)
应对算力瓶颈与生态迁移挑战 AI大模型训练与推理面临严峻算力需求与供应链风险。传统方案依赖国际厂商GPU,存在供应不稳定、成本高昂及合规风险。企业面临核心痛点:...
腾讯科技(深圳)有限公司 | 市场研究 (已认证)
针对AI出海面临的高延迟、潮汐流量算力瓶颈及
现在,SuperGrok的用户已经可以用上了,普通版月费30刀,Heavy版月费300刀。
在5月中旬,谷歌扔出的这个炸弹(号称是数学界AlphaGo的「第37步」时刻),就在不断冲击人们的认知——AI,已经拥有了自我进化能力!
Monica 目前还处于开发阶段,当前版本的可以参见 github 地址: https://github.com/fengzhizi715/Monica
本文聚焦大模型训推面临的算力、访存带宽及生态迁移瓶颈,提出基于“一云多芯”的国产GPU精细化选型矩阵(涵盖GPGPU与DSA架构)。通过覆盖真实业务场景的严格量...
在 AI 大模型训练、推理场景爆发式增长的今天,如何在 Kubernetes 集群中高效调度 GPU 资源,已成为云原生领域的关键技术。本文系统梳理 K8s...
这个话题十分有趣,Jimin Lee的文章就详细解释了这一困惑,我们来看看他是怎么说的。
在2026年NVIDIA GTC大会上,黄仁勋带着机器狗、趣味彩蛋走完舞台,在一众硬件新品里,藏着一个对企业技术决策者远比新显卡更重要的重磅发布:NemoCla...
我们可以把 GPU 里的 ** 线程块(Block)** 想象成一个个独立的 “小工作组”,它们并行干活,效率极高。但只要涉及 “跨组传数据”,老架构(Hopp...
先用LINE_STRIP实现了省界,一条线一个VAO在for循环里逐个渲染,目测对帧率没什么影响。GPU让我有些时候低估了CPU的效率。
参考 https://docs.vllm.ai/en/latest/features/sleep_mode/
手把手教你使用 Docker+GPUStack 快速搭建企业级大模型服务平台,轻松实现从单机到集群的高效扩展!
作者: HOS(安全风信子) 日期: 2024-09-13 主要来源平台: GitHub 摘要: 本文深入解析GPU集群破解经典加密的技术原理,从并行计算...
12月8日消息,据韩国媒体ZDNet Korea 报导,存储芯片大厂SK海力士已经修改HBM4生产计划,原本2026年2月量产HBM4、明年二季度扩大产量的计划...
11月28日消息,近日业内盛传美国科技巨头Meta可能会从2027年起采用谷歌自研的TPU芯片来用于满足自身的AI需求。如果接下来有更多的厂商选择谷歌的TPU,...
11月27日消息,业内传闻显示,由于DRAM内存芯片供应紧缺、价格持续上涨,英伟达已经停止向GPU板卡合作伙伴出售GPU捆绑的显存,导致合作伙伴自行采购所需的显...
11月25日消息,根据市场研究机构 Jon Peddie Associates 的最新报告,2025年第三季PC 显卡出货量环比增长了2.5%,但数据中心的GP...
11月13日,国产GPU厂商摩尔线程正式发布科创板上市招股意向书,其网下申购代码688795、网上申购代码 787795,拟发行7000万股,占发行后总股本 1...