首页
学习
活动
专区
圈层
工具
发布

#nvidia

Elasticsearch 向量索引速度提升 12 倍:在 GPU 和 CPU 层部署 NVIDIA cuVS

点火三周

NVIDIA cuVS 在 GPU 上构建 HNSW 图,使 Elasticsearch 中的向量索引速度最高提升 12 倍。本文将介绍两种生产部署模式:模式 ...

8110

使用NVIDIA AI-Q和LangChain构建企业搜索深度代理

用户11764306

作者: Sean Lopp, Sam Pastoriza, Ajay Thorve, Chantal D Gama Rose, Victor Moreira

10510

收藏!NVIDIA NemoClaw 10 大高频问题一次性讲清

GPUS Lady

以下是基于 NVIDIA NemoClaw GitHub Discussions 页面内容梳理的通用 Q&A(以下覆盖该仓库核心方向及高频潜在问题,结合社区常见...

4910

314| Nvidia AI工厂:重塑企业计算的底层逻辑

数据存储前沿技术

在摩尔定律放缓与算力需求爆炸的矛盾下,企业计算正经历一场范式转移。Nvidia 正在构建的“AI工厂”不仅是 GPU 的堆叠,更是一套旨在吸收传统 x86 架构...

17010

轻量 GPU 测试机 vLLM 镜像拉取失败排查记录

goodgood_live

记录一个小问题:我在一台轻量 GPU 测试机上复现 vLLM 服务,docker compose up -d 没有进入业务启动阶段,镜像下载先超时了。

8500

智能体部署再升级:NVIDIA NemoClaw 开始支持 Hermes

GPUS Lady

近日,NVIDIA 官方文档更新显示,其面向 OpenClaw 生态的开源安全部署栈 NemoClaw 已新增对 Hermes 智能体 的实验性支持,开发者可一...

19310

NVIDIA 开源 cuda‑oxide:纯 Rust 编写 CUDA 内核

GPUS Lady

NVIDIA终于可以公开过去半年 潜心研发的重磅成果 —— 正式开源了cuda‑oxide。这是一款实验性定制 rustc 编译器后端,最大亮点是可以用纯 Ru...

14110

Nvidia STX:从计算优化到数据路径控制,存储系统的架构重构

数据存储前沿技术

当AI工作负载从训练阶段转向推理阶段时,一个被长期忽视的瓶颈正在浮出水面——存储不再是被动的数据保管库,而是推理性能的决定性因素。

14610

中国芯片距离英伟达还有多远?

鱼片粥来碗豆腐

到了 2026 年的今天,站在这个节点回望,我感触最深的一点是:中国芯片与英伟达的差距,已经从过去那种“全方位的降维打击”,演变成了如今“局部突围、整体博弈、生...

23500

打破刻板印象:JAX 早已全面适配 NVIDIA GPU,轻松微调 Llama 3.1

GPUS Lady

在大模型高速发展的当下,PyTorch、TensorFlow 是大众最熟悉的深度学习框架,但还有一款高性能科学计算与 AI 框架JAX,长期笼罩在一层认知迷雾里...

12710

DGX Spark软件优化与模型加速技术

用户11764306

AI生成摘要:2026年CES发布的DGX Spark软件更新,通过软件优化、新模型更新和开源协作,为DGX Spark及基于OEM GB10的系统带来了重大性...

29020

ZStack dGPU:让虚拟机里的 GPU 也能按需切分

ZStack云计算

在 Kubernetes 生态中,GPU 共享调度已趋于成熟——时间片轮转、显存隔离、按 Pod 粒度分配,各家方案百花齐放。

14810

解锁边缘 LLM:Jetson Orin 内存管理与优化全攻略

用户4730701

在边缘设备上跑大语言模型(LLM),内存就是一切。 OOM、卡顿、启动崩溃、性能不稳定……90% 的问题都来自对「内存生命周期」与「统一内存架构」不理解。

39010

NVIDIA具身智能版图初探

霞姐聊IT

在具身智能(Embodied AI)和物理智能(Physical AI)的前沿技术中,NVIDIA无疑占据了一个重要的位置。

23810

DeepSeek-V4百万上下文来了,企业数据中心准备好了吗?

ZStack云计算

DeepSeek-V4提升了模型上限,但企业真正要解决的,是AI私有化部署后的落地上限。

29810

NVIDIA 重磅发布:人形运动与机器人学习全栈生态,AI 具身智能迎来「数据底座」革命

GPUS Lady

近日,NVIDIA 正式开源一整套面向人类 / 人形机器人运动生成与机器人学习的全栈技术生态,把「人体运动数据」从采集、生成、迁移、仿真到训练的全流程工具链彻底...

24010

NVIDIA新大招!GR00T N1.7来了,用人形数据让机器人变“灵巧手”

GPUS Lady

近日,NVIDIA正式发布Isaac GR00T N1.7(EA版)——一款开源、商业授权的视觉-语言-动作(VLA)人形机器人基础模型。该模型秉持一个核心前提...

41410

如何看待网传 DeepSeek V4 即将发布并提出「去CUDA化」?

鱼片粥来碗豆腐

我这两天也在看这个消息,说实话一开始看到“DeepSeek V4 + 去CUDA化”,我第一反应不是模型强不强,而是:这事如果是真的,影响其实比模型性能更大。

36120

无需编程!用自然语言就能操控机器人?NVIDIA这项技术改写机器人开发模式

GPUS Lady

你是否想象过,不用敲一行代码,只需随口说一句“向前移动两米”,机器人就能精准执行指令?如今,NVIDIA的开发者Umang Chudasama已经实现了这一场景...

15110

腾讯云轻量应用服务器 Hermes Agent如何配置自定义模型(Nvidia免费模型与deepseek)

Caihttt

最近又出了一个Agent ,叫Hermes Agent,很多人已经在使用了,但是对于Hermes Agent配置模型还不是特别了解

2.8K10
领券