首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >阿里、字节、腾讯,集体押注同一家机器人公司

阿里、字节、腾讯,集体押注同一家机器人公司

作者头像
数据微光
发布2026-05-11 13:24:04
发布2026-05-11 13:24:04
1230
举报

人类造过很多能干活的机器人。工业的、服务的、无人机、扫地的、擦窗的,名单拉出来一大串。

但真正大规模走进普通家庭的,只有一种。

扫地机

就这一种

前阵子纽约时代广场挂出一块马赛克机器人广告,就两行字,「It works around the house. It has a real brain.」后面跟了一行日期,4 月 17 日。

悬念吊了几天。

谜底揭晓,广告的主人是一家深圳公司,自变量机器人。他们在后来的发布会上干了一件更激进的事。先发布了一个叫 WALL-B 的新模型,然后宣布,机器人要搬进一个普通家庭,长期住进去。

不是上门干半小时就撤,是住进去。

这事以前可能真的没人干过

先说说自变量这家公司

自变量机器人(X Square Robot),深圳的,成立大概两年多。三位创始人都是清华出身。CEO 王潜,清华本硕;CTO 王昊;再加上联合创始人杨倩。都挺年轻,典型的从清华实验室一路带出来的团队。

融资速度很猛。

去年九月拿了 A+ 轮,近 10 亿人民币,阿里领投,阿里一家就砸了 1 亿美金进去。今年年初又紧接着 A++ 轮,还是 10 亿级,这次是字节跳动进来了。没多久红杉和美团又追投了一轮。最近据媒体消息,他们又拿了 B 轮 20 亿,小米和红杉中国领投,红杉算是第二次进场。足以看出红杉中国对自变量的看好。

成立两年左右,累计融资已经到了 50 亿左右

有个细节特别值得说一下。国内具身智能公司里,能同时拿到阿里、字节、腾讯三家钱的,目前只有自变量这一家。平时这三家在 AI 这块基本是各走各的,互相绕着走,能同时押一家机器人公司,本身就已经是个不小的信号了。

他们在做两条产品线。硬件这边是 Quanta X1 和 Quanta X2,已经进了真实家庭在上门干活。模型这边是 WALL-B,也就是这次发布会的主角。昊哥管它叫「世界统一模型」。这名字听着挺大,翻译一下就是,不管你让它干叠床单、擦桌子、套垃圾袋、还是别的什么新活儿,用的都是同一个模型、同一套参数。

他们已经在真的收钱干活

去年起,自变量和 58 同城合作,在深圳和北京开了家庭清洁服务。你在 App 里下单,上门的是一个组合:一个人类清洁工,再加一台自变量机器人。

机器人负责标准的活,擦桌子、捡地上的垃圾、把垃圾袋扎口、辅助叠床单。清洁工负责判断的活,哪里该擦得更仔细、贵重的东西怎么处理、跟主人怎么沟通。

首月就有五十多个家庭用了这个服务。价格大概是单请一个清洁工的一半,据说深圳的早期名额一上线就被约空。

这种状态在这两年的具身智能圈子里,真的不常见。大多数公司还在拍 demo 视频。机器人叠个衣服、煎个鸡蛋、做杯拿铁,镜头一关设备搬回实验室,视频剪一剪放到 X 上,再发几篇推文,再收一波融资。自变量把这一步跳过去了,直接切进了真实订单。

能切进去的原因其实不完全在技术。家政是一个高频但容错率很高的场景。擦错一张桌子的代价,跟工厂里抓错一个零件差了好几个数量级。家政也不需要那么精密的硬件,现有的机械手精度已经够用了。最关键的一点是,这个场景有现成的订单入口,58 同城。

能落地的公司,往往是那些最先找对场景的。

35 天学会做家务,到底是怎么做到的

传统机器人学一个新动作,方式挺工业化的。工程师得采集几百个小时的数据,做特征工程,写一堆控制规则,训练一个小模型。换一个动作,流程又要从头走一遍。所以过去的机器人一旦离开它被设定好的那个场景,立马变笨。

端到端模型走的是另一条路。

你直接把摄像头看到的画面和机器人对应的动作配成一组组数据,丢给一个大模型去训练。学叠床单,就把叠床单的视频和动作喂进去;学擦桌子,就把擦桌子的数据喂进去。模型自己会去学怎么控制关节、怎么理解场景。

这条路其实和 GPT 处理语言的思路很像。给它看足够多的语料,它自己学会说话,具体说什么它自己判断。

WALL-B 在这个路线上又走得更激进了一步。它的目标是一套参数跑所有任务,叠床单也好、擦桌子也好、套垃圾袋也好,背后都是同一个模型。昊哥在台上讲的时候也挺坦率的,说刚开始它可能干得不够好,但数据越跑越多,效果会越来越强。

35 天学会一项家务活,放在这个框架下是能跑通的。前提是,你得有海量的真实家庭数据喂给模型。家政场景里 1000 次擦桌子的数据,可能比实验室里 10000 次的采样还更有用。为什么呢,因为家庭环境是真的乱。光线、家具位置、地板反光、小孩玩具散落的角度,全是变量。模型得在这种噪声里学会泛化。

这也是 PI 和自变量现在节奏差别的关键。PI 在实验室里反复打磨 π0 和 π0.5 的泛化能力,技术指标漂亮,但数据还在小规模阶段。自变量选的是另一个打法,先跑起来再说,每一单活、每一次失败,都能变成训练数据

当然端到端路线也有它的代价。模型为什么做这个动作,没法解释清楚;出错之后很难定位问题。长尾场景也难提前覆盖,比如小孩突然把玩具扔过来、宠物跳上桌子、家里突然停电。这些弱点,目前看只能靠更多的真实家庭数据去补。

家政订单本身就是一个数据飞轮。你每做一单,就在采一波数据。做得越多,模型越强,越能处理更复杂的场景,订单就越能往外扩。

为什么这事非得发生在家里不可

开头我就说了,过去几十年能大规模走进家庭的机器人,其实只有扫地机器人一种。

原因也不神秘。扫地机面对的场景被简化到极致。平面地板、固定家具、已知形状的障碍物,它不用抓东西,不用处理柔性物品,不用跟人协作。扫地机卡在了家庭里唯一它能钻过去的那条门缝。

家务这件事真正难的地方,其实从来不在单个动作上。动作本身没那么复杂。难的是环境的不确定性。

一件衣服可能叠出一百种形状,一个水杯可能装满也可能是空的,一个小孩可能在你身后突然出现。工厂能把所有变量钉死,家庭恰好反过来,家里就是一个永远在乱的系统

这个场景难归难,但它恰好也是具身智能这一波最大的商业机会。全球家政是个万亿美金级的市场。你看中国一二线城市,家政从业者平均年龄已经超过 45 岁了,愿意干这一行的年轻人越来越少,时薪还在年年涨。

阿里、字节、腾讯三家同时下注的逻辑,其实就藏在这里。他们押的是一个能走进家庭的入口。一台机器人真进了你家,就等于一个带着摄像头、麦克风、传感器、算力的终端在你客厅里。后面能接的事,远远不止擦桌子叠床单这么简单。

住进家里这一步,是最大的豪赌

上门干半小时,和长期住在一个家里,这是两种完全不同量级的难度。

上门是任务型的。清洁工上门之前会跟主人打个招呼,主人会把贵重的东西收起来,宠物关起来,整个家会进入一种临时的、配合服务的状态。机器人只需要处理一小段时间内的清洁任务。

长期居住,是生活流。

早上七点有人起床,晚上家里来了朋友喝酒聊天,小孩半夜醒了要喝水,宠物随时可能跑过来咬电源线。这些场景全都没被提前编程过,机器人得自己处理。

更头疼的是信任问题。一台上门的机器人,打破个杯子,客户的心理损失有限,反正它半小时后就走了。一台住在你家里的机器人,万一误伤了家人、让小孩学了什么奇怪的动作、或者被怀疑偷偷录下了家里的什么,这种事赔钱也解决不了。品牌信任这个东西破一次,几乎不可能修回来。

所以这次发布会我看下来,感觉挺复杂的。

里面是有泡沫的,这一点我不打算假装看不到。

时代广场挂广告、悬念吊一周、发布会上宣布机器人要入住真实家庭,这一整套叙事工整得像个美剧预告片。每一步都精准踩在了行业情绪点上。

但有意思的地方就在这里。自变量这次反而挺诚实的。

昊哥在台上讲 WALL-B 的时候说,刚开始它可能干得不够好,但会越来越强。王潜前两天接受媒体采访,直接讲机器人赛道在资本上其实是过冷的,还远没到过热。一家正在狠狠套现热度的公司,居然没把自己架得那么高。

我自己看下来的判断是这样的。

具身智能这一波,真正的壁垒说到底就是数据。不是模型参数,也不是本体精度。

但数据这玩意不是你想采就能采到的。你得先把两个门槛迈过去。

一个是,你得真有干活的能力。模型不能是 PPT 货,硬件不能是摆设,再糙也得能上手干活。不然用户用一次就不会有第二次。

另一个是,你得被允许进入家庭。愿意开门让机器人进来的人,其实不多。每一个背后都得有一套东西撑着,用户信任、订单渠道、持续的服务关系,一样都不能少。

这两个门槛,放到国内来看,自变量可能都是目前跨得最快的那一个

跨过去之后,飞轮就开始转了。刚开始它干得不够好,这其实挺正常的,但数据在不停累积,模型会一点点变强。模型变强之后会有更多人愿意用,更多人用就意味着更多数据,数据更多模型就又更强。一圈一圈滚起来。

至于宣传上那些泡沫、时代广场的悬念、机器人入住家庭的叙事包装,等到机器人真的能把活干好的那天,又有几个人会记得呢。

所以在具身智能这一轮里,能更早走进真实场景、更早开始攒数据的公司,大概率就是最后赢的那家。

而自变量这一步,已经领先了。

写在最后

具身智能这一波,真正拉开差距的地方,可能既不在论文上,也不在实验室跑出来的分数上。在谁敢进家,和谁能先进得去。

进家的代价挺高的,收益也远。但一旦数据真的跑起来了,护城河就开始一点点长出来了。

中国公司在这件事上,其实有个挺少被人提起的优势。人工成本涨得快,58 同城这类订单入口够密,家庭样本也足够杂。这些条件硅谷那边真的很难复制。

自变量这一步跨得够大。它赌的不是技术最领先,是能不能熬过那段每天都可能出事故的试运营期。熬过去,飞轮就开始转。熬不过去,牌子也就砸了。

技术指标可以藏在论文里,但真实家庭不会撒谎。

看清方向,比跑得快更重要。我是向光,下次见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据微光 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 先说说自变量这家公司
  • 他们已经在真的收钱干活
  • 35 天学会做家务,到底是怎么做到的
  • 为什么这事非得发生在家里不可
  • 住进家里这一步,是最大的豪赌
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档