首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具

GPUS开发者

专注NVIDIA Jetson产品开发。
专栏成员
1154
文章
1950748
阅读量
215
订阅数
nvmath Python革命:如何让CUDA数学库易用?
接上一篇:CUDA Python的「黄金三角」:PyTorch+RAPIDS+CuPy如何重构科学计算
GPUS Lady
2025-04-18
130
CUDA Python的「黄金三角」:PyTorch+RAPIDS+CuPy如何重构科学计算
当我们在讨论这个主题时——大家可以看到CUDA Python生态中层层叠叠的各个组件:从顶层的框架与SDK,一直延伸到需要直接操作硬件的CUDA内核开发层。实际上这里的组件远不止幻灯片上能展示的数量,但我们可以将其视为开发者工具箱,这些工具需要组合使用才能构建出GPU加速的Python程序。
GPUS Lady
2025-04-18
110
深度揭秘NVIDIA 第三代计算机Jetson Thor
在开始深入细节之前,我想先谈谈我们的观察。我们开发Jetsen和边缘AI已有超过10年的时间,在机器人领域发现了许多共性。
GPUS Lady
2025-04-16
1200
CUDA编程革命:cuTile分块计算赋能高效GPU开发
当遇到库中缺少所需功能的情况时(这种情况可能占开发时间的10%甚至1%),或者需要将不同代码模块粘合时,我们提供了多个解决方案。
GPUS Lady
2025-04-09
1370
NVIDIA Isaac Sim 4.5 升级指南:5 大关键调整避免“踩坑”
1.依赖项调整:检查项目中使用的依赖项,文档显示新增了如isaacsim.exp.full: 4.5.0等多个依赖项,同时移除了omni.anim.navigation.bundle: 106.1.0等一些旧依赖,还有大量依赖项进行了版本更新。需确保项目依赖与新版本兼容,可能要更新代码中对依赖项的引用,避免因依赖问题导致功能异常。
GPUS Lady
2025-04-04
1691
CUDA工具集合与Python深度集成:重塑GPU编程新体验
实际上,CUDA的奥秘在于它并非单一工具,正如Jensen几小时前在主题演讲中提到的,它是我们长期积累的庞大工具集合,可灵活应用于各类问题。过去一两年,我们重点推进的一项工作是将加速Python深度集成到CUDA堆栈中。因为CUDA本身并非孤立工具,Python也不能仅停留在表面——我们不仅需要内核编写能力,更需要完整的工具链支持,从上到下无缝衔接。例如,你既需要能将内核嵌入PyTorch,也需调用Python生态的各类库。
GPUS Lady
2025-04-02
1900
英伟达全栈工具链如何重构Groot机器人开发链路(4)
英伟达全栈工具链如何重构Groot机器人开发链路(一) 英伟达全栈工具链如何重构Groot机器人开发链路(2) 英伟达全栈工具链如何重构Groot机器人开发链路(3)
GPUS Lady
2025-04-01
1040
英伟达全栈工具链如何重构Groot机器人开发链路(3)
我们的目标是设计一个适配GPU的模型规模。然而,双参数模型本身规模较大。在机器学习领域,通常认为拥有大量参数的模型需要大量数据点进行训练,以确保模型既具备强大的表达能力,又能满足数据需求。为解决数据需求问题,特别是在机器人训练领域,我们引入了“数据许可”的概念,这一概念大约在两年前提出。
GPUS Lady
2025-03-28
680
英伟达全栈工具链如何重构Groot机器人开发链路(2)
让我们假装自己是一名神经外科医生,你面前有一个大脑,不过这个大脑不在生物体内,而是在实验室里。与那些生活在云端的大型语言模型(如GPT等)不同,这个大脑实际上运行在硬件上,它能直接与现实世界进行交互。这就是Groot,世界上首个开放的人形基础模型。接下来,我将和大家一起深入了解这个新奇的“网络”。
GPUS Lady
2025-03-27
670
英伟达全栈工具链如何重构Groot机器人开发链路(一)
小编整理了NVIDIA GTC Watch Party《构建人形机器人介绍》讲座内容。
GPUS Lady
2025-03-27
1070
AI算力革命登陆桌面:ASUS Ascent GX10超级计算机重塑开发范式
继NVIDIA去年GTC 2024大会发布颠覆性Project DIGITS桌面超算、引发科技界震动后,全球硬件巨头ASUS今日正式推出其深度定制版本——Ascent GX10 AI超级计算机。这款搭载NVIDIA首款桌面级GB10 Grace Blackwell超级芯片的设备,不仅延续了Project DIGITS将petaflop级算力带入开发者桌面的创举,更通过独创的异构架构优化,将AI模型开发效率推向新高度。
GPUS Lady
2025-03-19
2860
Gemma 3多模态模型发布:AI资源平衡与灵活部署的新选择
在人工智能(AI)领域,随着AI驱动的应用程序生态系统迅速扩张,将生成式AI能力融入其中已成为开发者的热门追求。然而,这一过程并非简单地“一揽子”解决方案,而是需要在内存、延迟、存储、计算能力等多种资源之间进行精细的平衡。对于开发者而言,在管理成本和用户体验时,没有一种通用的方法能够适用于所有情况。因此,我们需要高质量、可定制的模型,这些模型能够支持在不同计算环境(从数据中心到边缘计算再到设备端应用场景)中托管和部署的大规模服务。
GPUS Lady
2025-03-17
1750
NVIDIA Isaac Sim安装疑难杂症攻克记:两周问题总汇与实战攻略
NVIDIA机器人技术练气群已经成立两周有余,我们始终致力于将这个群聊打造成为一个ISAAC开发者们自由交流、分享经验以及进行技术实操的活跃平台。近两周来,群内成员们展开了热烈的讨论,积极分享自己在安装和使用NVIDIA ISAAC过程中遇到的各种问题。
GPUS Lady
2025-03-13
4211
高盛观点:中国低成本AI模型或推动全球AI应用提速
DeepSeek为代表的中国公司已成功开发出成本远低于现有产品的先进生成式人工智能(AI)模型。高盛研究部认为,这一突破可能促进AI技术的更快采用,并对全球经济增长产生更大影响。
GPUS Lady
2025-03-03
1080
微软发布Phi系列新成员:Phi-4-multimodal与Phi-4-mini,引领小型语言模型新潮流
本周,微软宣布推出Phi家族的最新成员——Phi-4-multimodal和Phi-4-mini,这两款小型语言模型(SLMs)旨在为开发者提供先进的AI能力,开启智能应用的新篇章。
GPUS Lady
2025-02-28
2040
NVIDIA PTX指令集大揭秘:非CUDA替代品,而是底层控制语言
最近,DeepSeek采用了NVIDIA PTX指令集(Parallel Thread Execution ISA)来提升执行效能。然而,这一举动却导致了一些新闻媒体错误地传递了信息,声称PTX将取代CUDA,甚至可以用PTX来绕过CUDA。实际上,PTX是NVIDIA GPU最底层的控制语言,正因为它非常接近硬件层,对于大部分开发者来说学习门槛较高,所以才有了CUDA来简化开发过程。
GPUS Lady
2025-02-07
1.7K0
有容乃大,刚刚NVIDIA NIM集成DeepSeek,正式上线
这个春节真是热闹非凡,大家还沉浸在节日的喜悦中,并热议着DeepSeek如何在美国股市掀起波澜,让NVIDIA股票在一夜之间下跌了17%。当大家纷纷揣测“这下梁子可结大了”的时候,NVIDIA却迅速做出了反应,在NVIDIA NIM上集成了DeepSeek R1版本。这一系列事件无疑为这个蛇年春节增添了几分不同寻常的科技色彩。
GPUS Lady
2025-02-04
3200
NVIDIA Blackwell RTX GPU与CUDA 12.8框架更新指南
随着NVIDIA Blackwell RTX GPU的发布,为了确保应用程序与这些新一代GPU的兼容性和最佳性能,应用开发者必须更新到最新的AI框架。NVIDIA专门发布了一个指南,详细介绍与NVIDIA Blackwell RTX GPU兼容所需的核心软件库更新,特别是CUDA 12.8的相关信息。
GPUS Lady
2025-02-04
1.3K0
NVIDIA推出Launchables:为AI开发者量身打造的一键式GPU环境!
NVIDIA推出的Launchables功能,这是一个旨在简化AI开发流程、加速实验和部署的一键式部署GPU开发环境。NVIDIA通过提供预配置的GPU计算环境,使开发者能够快速启动参考工作流程并开始构建,从而降低了AI开发的复杂性和时间成本。
GPUS Lady
2025-01-22
1060
今日起,NVIDIA Jetson Orin NANO和Orin NX模组也可以升级成Super模式
昨晚,NVIDIA在其论坛上公布了JetPack 6.2版本,意味着NVIDIA Jetson Orin NANO和Orin NX模组也可以升级成Super模式
GPUS Lady
2025-01-19
1K0
点击加载更多
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档