首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >重磅开源!4200万参数SONIC模型,让人形机器人拥有人类自然全身运动能力

重磅开源!4200万参数SONIC模型,让人形机器人拥有人类自然全身运动能力

作者头像
GPUS Lady
发布2026-05-13 17:02:10
发布2026-05-13 17:02:10
1600
举报
文章被收录于专栏:GPUS开发者GPUS开发者

早在今年2月,我们就曾为大家介绍过NVIDIA开源SONIC人形机器人全身控制模型(NVIDIA开源SONIC,让人形机器人控制实现规模化通用,这款专为仿生运动打造的基础模型,凭借对标人类的自然运动能力,一度成为人形机器人具身智能领域的焦点技术方案。如今,重磅更新再度来袭:SONIC完整开源安装包正式全面上线,标志着这项前沿技术正式向全球开发者开放全栈能力,为人形机器人自然运动控制、通用化落地带来了重磅技术革新,也为全球机器人研发社区提供了一套高性能、可复用、可拓展的底层运动控制基础方案。

SONIC是一款拥有4200万参数的人形机器人全身控制通用基座模型,核心目标是复刻人类自然运动逻辑。该模型依托海量人类运动数据开展深度学习训练,彻底摆脱传统机器人动作僵硬、场景单一、适配性差的痛点,能够让机器人输出高度贴近人类的流畅、自然、稳定的全身运动效果。

在功能适配层面,SONIC具备极强的多模态指令响应能力,可将各类差异化指令,精准转化为稳定、自然的机器人全身行为。其全面支持VR远程操控、真人视频动作追踪、文本指令驱动、音乐联动运动、物体交互操作,以及基于GR00T视觉语言动作模型(VLA)的移动操控等多元场景,实现了单一模型覆盖多类运动控制任务,大幅提升了人形机器人的运动通用性与场景适配能力。

相较于传统机器人控制模型,SONIC的核心突破源于全方位的规模化技术升级。研发团队从模型参数、训练数据、算力资源三大核心维度完成跨越式迭代:模型参数从最初的120万迭代至420万,大幅提升运动特征学习能力;依托700小时高质量动作捕捉数据,构建起超1亿帧的大规模训练数据集;同时投入21000小时GPU算力完成全维度训练,让模型充分学习人类各类运动细节与运动规律。

为高效完成大规模强化学习训练,研发团队基于NVIDIA Isaac Lab仿真平台开展技术突破,通过128块GPU实现超50万台机器人并行仿真训练。这一架构将物理仿真运算速度提升10000倍,仅需数小时的真实时长,就能让机器人积累等同于数年的虚拟运动经验,极大缩短了模型训练周期,同时夯实了模型的运动稳定性与泛化能力。

更具落地价值的是,SONIC具备强大的零样本迁移能力。该模型无需任何微调优化,即可直接部署于真实G1人形机器人,在各类复杂的真实场景运动序列任务中,均能实现极高的执行成功率,真正打通了仿真训练到真机落地的技术壁垒,解决了多数机器人模型仿真效果好、真机落地差的行业难题。

本次开源的完整工具包,覆盖了研发与落地全流程核心资源,包含模型训练代码、推理部署代码、完整模型权重、GR00T VLA后置训练流程,以及Bones平台开源的动作捕捉数据集、适配G1机器人的重定向数据集。全套资源免费向开发者社区开放,不仅支持科研人员开展二次研究,也能助力开发者基于SONIC技术框架,快速适配不同形态的人形机器人,打造专属的通用全身控制方案。

SONIC的开源落地,标志着人形机器人运动控制正式迈入规模化、通用化、开源化新阶段,将有效降低行业研发门槛,加速自然人形机器人在交互、服务、作业等多场景的商业化落地,为人形机器人产业的快速迭代提供核心技术支撑。

网站介绍:https://nvlabs.github.io/GEAR-SONIC/

代码和权重:https://github.com/NVlabs/GR00T-WholeBodyControl

白皮书:https://arxiv.org/abs/2511.07820

数据:https://bones.studio/datasets/seed

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档