gpu - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签gpu

#gpu

MAC使用MPS进行GPU深度模型训练（MPS替代CUDA）

老周聊架构 15小时前2025-11-20 10:39:22

随着深度学习的广泛应用，硬件加速成为了模型训练的重要因素。GPU凭借其强大的并行计算能力，已经成为深度学习训练的首选设备。然而，在不同的操作系统上，由于硬件厂商...

1600

GPUSTACK Docker 容器化部署指南

轩辕镜像 16小时前2025-11-20 10:08:16

GPUSTACK 是一款专注于 GPU 集群管理的中间件，旨在简化大语言模型（LLMs）及其他 GPU 密集型应用的部署与运行流程。通过统一的集群管理接口，GP...

3400

通用具身智能要来了！卡内基梅隆&Meta发布效率之王MetaVLA：训练步数降3倍，GPU时间少76%

AI生成未来 3天前2025-11-17 15:49:30

文章链接：https://arxiv.org/pdf/2510.05580 项目链接：https://stellar-neuron.github.io/met...

8910

65_GPU选择：A100 vs RTX系列

安全风信子 4天前2025-11-16 13:39:20

在2025年的今天，大语言模型（LLM）已经成为人工智能领域的核心技术之一。从GPT-5到Llama 4，从专业领域应用到消费级产品，LLM正在以前所未有的速度...

12110

42_大语言模型的计算需求：从GPU到TPU

安全风信子 4天前2025-11-16 12:34:11

随着2025年大语言模型技术的持续突破和规模化应用，计算资源已成为推动AI发展的关键驱动力。从最初的CPU计算，到GPU加速，再到专用AI加速器的崛起，大语言模...

16210

GPU集群扩展：Ray Serve与Celery的技术选型与应用场景分析

deephub 5天前2025-11-15 11:11:11

当你需要处理大规模并行任务，特别是涉及GPU集群的场景时，Ray Serve和Celery是两个主要选择。但它们的设计理念完全不同：

5510

vGPU显存任意切终于来了，Nvidia vGPU支持混合大小模式

SuperDream 6天前2025-11-14 12:41:46

曾经在VDI类的Nvidia vGPU场景，每个GPU核心只能采用1种固定切分模式，例如Nvidia A40只有一个GA102的核心，就只能切分一种模式，48G...

15510

面向AI的新一代存储GPU Direct Distributed File System来了

皮振伟 8天前2025-11-12 20:39:59

从2017年开始，我陆续在这里分享了一些关于内核/虚拟化、存储虚拟化、KV 数据库和操作系统基础组件相关的文章，也收获了不少读者的好评。如果这些内容能在大家的工...

9910

【教程】nvidia-smi dmon获取GPU相关的完整信息

小锋学长生活大爆炸 28天前2025-10-23 22:03:21

👉 每秒采样 GPU 活跃度、SM 活跃度、PCIe Tx/Rx，直接保存到 CSV。

20900

首都在线董事长曲宁：AI推理时代，云计算如何走出GPU碎片化困局？ | 数据猿专访

数据猿 30天前2025-10-21 15:55:36

随着人工智能技术的飞速发展，云计算行业正经历一场深刻的转型，从传统的通用计算迈向智能化、场景化的智算时代。在这场变革中，众多云服务商积极拥抱机遇，构建面向未来的...

16310

Nat. Methods | GPU 加速的 MMseqs2 同源搜索

DrugOne 2025-10-142025-10-14 16:29:35

随着蛋白质数据库规模的快速增长，对更快、更敏感的同源性搜索工具的需求愈发迫切。研究人员开发了 GPU 加速版 MMseqs2 (MMseqs2-GPU)，在单一...

15010

告别重复编译！CUDA 13.0统一Arm/服务器工具链，边缘开发效率提升300%

GPUS Lady 2025-10-102025-10-10 12:23:16

随着NVIDIA Blackwell GPU架构赋能的Jetson Thor SoC发布，CUDA 13.0通过一系列创新优化，重新定义了嵌入式与边缘AI的开发...

38710

内存焦虑？长文梳理： HBM/DRAM/CXL/HBF/GPU-Direct

数据存储前沿技术 2025-10-092025-10-09 10:42:56

在人工智能，特别是大语言模型（LLM）和基础模型飞速发展的今天，模型的规模和复杂性呈指数级增长，对内存容量和带宽的需求急剧膨胀，传统CPU-DRAM与块存储的两...

1.2K20

GPU编程与架构：你新买的5090到底是怎么工作的？

腾讯云开发者 2025-09-302025-09-30 14:37:57

“你买的4090多少钱？”、“H100性能真厉害！” ，GPU的价格性能一直是大家乐于谈论的话题，作者也经常可以在茶余饭后听到这样的讨论。在热火朝天地谈论性能指...

35910

超级计算力量：一文看懂GPU并行计算CUDA

Lion 莱恩呀 2025-09-162025-09-16 23:12:26

CUDA（Compute Unified Device Architecture），是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通...

81700

致敬园丁，腾讯云HAI献礼教师节！GPU算力券5折起

腾讯云计算产品团队

腾讯云｜产品团队 (已认证)

2025-09-112025-09-11 18:43:37

大型语言模型（LLM）部署、AI作画、数据科学项目需要强大的GPU算力支持，但动辄上万的硬件投入和维护成本让人望而却步。现在，腾讯云高性能应用服务HAI为您提供...

18310

gpu线上测试(毒蘑菇测试)

用户10974407 2025-09-102025-09-10 16:40:23

起初，我在搜索引擎里输入 “GPU 性能测试工具”，结果跳出的全是需要下载安装的软件。有的工具安装包动辄好几百兆，还附带一堆捆绑插件，一不小心就会把电脑弄得乌烟...

1.4K10

服务器核心组件：CPU 与 GPU 的核心区别、应用场景、协同工作

云惑雨问 2025-09-082025-09-08 18:06:06

在服务器硬件里，CPU和GPU就像两位各司其职的“核心工匠”：一个擅长处理复杂精密的“细活”，一个精通批量高效的“粗活”。很多人知道它们都是“计算引擎”，却分不...

35610

开发 Operator 调度 GPU 实例资源池

没有故事的陈师傅 2025-09-042025-09-04 12:00:00

作者：乔克公众号：运维开发故事博客：https://jokerbai.com

21510

#gpu

MAC使用MPS进行GPU深度模型训练（MPS替代CUDA）

GPUSTACK Docker 容器化部署指南

通用具身智能要来了！卡内基梅隆&Meta发布效率之王MetaVLA：训练步数降3倍，GPU时间少76%

65_GPU选择：A100 vs RTX系列

42_大语言模型的计算需求：从GPU到TPU

GPU集群扩展：Ray Serve与Celery的技术选型与应用场景分析

vGPU显存任意切终于来了，Nvidia vGPU支持混合大小模式

面向AI的新一代存储GPU Direct Distributed File System来了

【教程】nvidia-smi dmon获取GPU相关的完整信息

首都在线董事长曲宁：AI推理时代，云计算如何走出GPU碎片化困局？ | 数据猿专访

Nat. Methods | GPU 加速的 MMseqs2 同源搜索

告别重复编译！CUDA 13.0统一Arm/服务器工具链，边缘开发效率提升300%

内存焦虑？长文梳理： HBM/DRAM/CXL/HBF/GPU-Direct

GPU编程与架构：你新买的5090到底是怎么工作的？

超级计算力量：一文看懂GPU并行计算CUDA

致敬园丁，腾讯云HAI献礼教师节！GPU算力券5折起

gpu线上测试(毒蘑菇测试)

服务器核心组件：CPU 与 GPU 的核心区别、应用场景、协同工作

开发 Operator 调度 GPU 实例资源池

热门专栏

腾讯云服务器团队的专栏

饶文津的专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐