暂无搜索历史
当前算力基建已是 AI 领域核心风口,国内2026年度投资规模预估将突破 1.5 万亿元,行业预测未来五年的复合年均增长率保守超 40%,至2030年将超过5万...
本课程隶属于英伟达认证专业人工智能网络工程师(NCP-AIN)培训体系,带你掌握面向人工智能业务的高性能网络拓扑设计与优化方法。
在入门GPU编程,尤其是基于CUDA的并行开发时,大多数开发者会重点关注核函数、显存拷贝、算力调度等核心内容,却常常忽略一个决定GPU计算效率的核心细节——CU...
以下是基于 NVIDIA NemoClaw GitHub Discussions 页面内容梳理的通用 Q&A(以下覆盖该仓库核心方向及高频潜在问题,结合社区常见...
有开发者基于DGX Spark打造了一款轻量化离线语音听写工具——spark-dictate,以解决传统在线语音工具隐私泄露、网速受限、高额收费等痛点。日常办公...
近日,NVIDIA 官方文档更新显示,其面向 OpenClaw 生态的开源安全部署栈 NemoClaw 已新增对 Hermes 智能体 的实验性支持,开发者可一...
近期一技术开发者完成了一套4节点DGX Spark分布式大模型推理集群的搭建与全场景性能实测,专门用于LLM分布式推理任务。
早在今年2月,我们就曾为大家介绍过NVIDIA开源SONIC人形机器人全身控制模型(NVIDIA开源SONIC,让人形机器人控制实现规模化通用),这款专为仿生运...
NVIDIA终于可以公开过去半年 潜心研发的重磅成果 —— 正式开源了cuda‑oxide。这是一款实验性定制 rustc 编译器后端,最大亮点是可以用纯 Ru...
提到GPU的并行计算,很多人都知道一个基础概念:GPU会将线程分成32个一组的“线程束”(warp)来执行。但今天我们要聊的,远不是这个入门知识点——而是一个更...
在边缘设备上跑大语言模型(LLM),内存就是一切。 OOM、卡顿、启动崩溃、性能不稳定……90% 的问题都来自对「内存生命周期」与「统一内存架构」不理解。
在大模型高速发展的当下,PyTorch、TensorFlow 是大众最熟悉的深度学习框架,但还有一款高性能科学计算与 AI 框架JAX,长期笼罩在一层认知迷雾里...
Gemma 4 推出了一系列强大的全新原生多模态与多语言模型家族,可完整适配 NVIDIA 全系列硬件 —— 从数据中心的 Blackwell 架构到边缘端的 ...
现在生成式 AI 越来越火,大家都想把大模型搬到机器人、自动驾驶、智能摄像头这类边缘设备上,不用依赖云端也能本地运行。但边缘设备有个大难题:内存太小,大模型动不...
近日,NVIDIA 正式开源一整套面向人类 / 人形机器人运动生成与机器人学习的全栈技术生态,把「人体运动数据」从采集、生成、迁移、仿真到训练的全流程工具链彻底...
近日,NVIDIA正式发布Isaac GR00T N1.7(EA版)——一款开源、商业授权的视觉-语言-动作(VLA)人形机器人基础模型。该模型秉持一个核心前提...
在GPU并行计算的世界里,有一个“隐形陷阱”常常困扰着开发者——当两个SM(流式多处理器)需要共享数据时,明明代码逻辑无误,却会出现诡异的计算错误。这背后的“元...
你是否想象过,不用敲一行代码,只需随口说一句“向前移动两米”,机器人就能精准执行指令?如今,NVIDIA的开发者Umang Chudasama已经实现了这一场景...
在NVIDIA GTC 2026大会期间,NVIDIA 首席科学家、GPU 架构师 Bill Dally与谷歌首席科学家、TPU 联合发起者、Gemini 联合...
还有没有人刷到CUDA相关内容,却始终不知道它到底是什么?今天我们就跳出复杂的技术术语,用最通俗的方式,聊聊这个撑起整个AI时代的“隐形功臣”,顺便分享一个你大...