具身智能卡壳多年，中国AI突然亮剑，开源模型藏大招|机器人|大模型|中国ai

具身智能卡壳多年，中国AI突然亮剑，开源模型藏大招

2025-12-11 09:01:18　来源: 快看张同学

江西举报

分享至

哈喽大家好，今天老张带大家聊聊AI圈最近上演了一出“逆袭大剧”！

全球都在愁具身智能怎么落地，结果中国团队直接扔出王炸——大晓机器人开源了开悟3.0，这可是全球首个能商用的世界模型，一下就把行业卡了好几年的“死结”给解了。

逆袭大剧

说起来，以前教机器人干活简直离谱。人类得穿VR设备、动作捕捉服，“附身”在机器人身上手把手教，叠衣服、拿苹果都得这么来，这就是所谓的“遥操作”。

商汤联合创始人、大晓董事长王晓刚一句话戳破真相：“这根本是倒退回AI 1.0，有多少人工才多少智能！”要教机器人做饭，总不能让几百万人穿动捕服炒菜吧？

更坑的是，AI自己生成的数据还净犯“物理病”，杯子凭空飘、水流往上流，给机器人学这些，纯属误导。

合着之前的机器人都是“没常识的学渣”，既不会自主学，又记不住规律，这行业能不卡壳吗？就在大家都死磕“怎么教”的时候，大晓突然换了赛道。

他们搞的“环境式数据采集”，让AI像婴儿一样靠“看”学东西：用AR眼镜拍第一视角，环境摄像头拍第三视角，看一万遍厨师颠勺，不光记像素，还能摸清发力角度、摩擦反馈，这才是真懂“干活逻辑”，不是瞎模仿。

双buff加持

开悟3.0能这么横，全靠两个“黑科技”，正好戳中行业两个痛点：不懂物理、记不住事。

第一个是和南洋理工一起搞的Puffin技术，堪称“空间透视眼”。传统AI看个矿泉水瓶，都不知道自己是站着看还是蹲着看，生成画面总崩。Puffin偏能把相机的光圈、焦距、拍摄角度，都变成可处理的信息，跟“猫”“苹果”一样好识别。

给它一张照片，它不光认得出瓶子，还能反推拍摄者在哪、怎么动，甚至能模拟绕到瓶子后面看的效果。机器人抓易碎玻璃杯前，先在脑子里“预演”：怎么发力不捏碎？移动时光影对不对？这才是真懂物理，不是靠运气（论文链接：
https://arxiv.org/abs/2510.08673）。

第二个WorldMEM架构，专治AI的“健忘症”。以前AI生成视频超几秒就崩，房子突然没了、书变没了都是常事。开悟3.0用线性注意力机制，把计算成本从指数级降到线性级，相当于装了“无限记事本”——机器人把书放进书架第二层，十分钟后回来，书还在原地，不会变别的东西。

现在它能生成长达几分钟的1080P高清视频，静态桌子、动态行人都能精准认，再也不“失忆”了（论文链接：
https://arxiv.org/abs/2504.12369）。对比李飞飞团队的Marble，人家偏静态3D建模，开悟3.0聚焦动态物理交互，推椅子会倒、开冰箱灯会亮，这才是具身智能真需要的。

开源+软硬一体

大晓的战略才真叫高。王晓刚这背景就不一般：中科大少年班出身，MIT计算机博士，论文被引超14万次，还兼着香港中文大学教授、商汤董事。

他早就看清行业死结：纯软件公司像“缸中之脑”，有智商没触觉；纯硬件公司“四肢发达”，没认知，都是死路。

所以大晓走了“第三条路”：自研“具身超级大脑模组”和四足/通用机器人，搭了个“采集-模拟-验证”的闭环。这模式有“飞轮效应”：机器人用得越多，数据越丰富；模型越精准，机器人越好用，跟特斯拉一个道理。

更绝的是，全球巨头都在筑技术壁垒，大晓却把开悟3.0开源了！现在中国开源AI模型的全球下载份额已经超美国，大晓这波就是要当世界模型领域的“DeepSeek”，把顶尖能力开放给所有开发者。

对中小企业来说，这简直是福音：不用砸钱研发基础模型，直接用开悟3.0做应用，工业质检机器人能快速识别缺陷，家庭护理机器人能掌握帮扶力度，落地门槛一下就低了。

而且开悟3.0还适配了国产芯片，这格局绝了。现在具身智能正迎来爆发期，政策支持力度越来越大，未来3-5年就是规模化关键期。

开悟3.0的出现，不光让中国抢占了先发优势，更给出了不一样的中国方案：不靠封闭壁垒，靠开源生态拉着全行业一起进步。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.