哈喽大家好,今天老张带大家聊聊AI圈最近上演了一出“逆袭大剧”!
全球都在愁具身智能怎么落地,结果中国团队直接扔出王炸——大晓机器人开源了开悟3.0,这可是全球首个能商用的世界模型,一下就把行业卡了好几年的“死结”给解了。
![]()
![]()
逆袭大剧
说起来,以前教机器人干活简直离谱。人类得穿VR设备、动作捕捉服,“附身”在机器人身上手把手教,叠衣服、拿苹果都得这么来,这就是所谓的“遥操作”。
商汤联合创始人、大晓董事长王晓刚一句话戳破真相:“这根本是倒退回AI 1.0,有多少人工才多少智能!”要教机器人做饭,总不能让几百万人穿动捕服炒菜吧?
![]()
更坑的是,AI自己生成的数据还净犯“物理病”,杯子凭空飘、水流往上流,给机器人学这些,纯属误导。
合着之前的机器人都是“没常识的学渣”,既不会自主学,又记不住规律,这行业能不卡壳吗? 就在大家都死磕“怎么教”的时候,大晓突然换了赛道。
![]()
他们搞的“环境式数据采集”,让AI像婴儿一样靠“看”学东西:用AR眼镜拍第一视角,环境摄像头拍第三视角,看一万遍厨师颠勺,不光记像素,还能摸清发力角度、摩擦反馈,这才是真懂“干活逻辑”,不是瞎模仿。
![]()
![]()
双buff加持
开悟3.0能这么横,全靠两个“黑科技”,正好戳中行业两个痛点:不懂物理、记不住事。
第一个是和南洋理工一起搞的Puffin技术,堪称“空间透视眼”。传统AI看个矿泉水瓶,都不知道自己是站着看还是蹲着看,生成画面总崩。Puffin偏能把相机的光圈、焦距、拍摄角度,都变成可处理的信息,跟“猫”“苹果”一样好识别。
![]()
给它一张照片,它不光认得出瓶子,还能反推拍摄者在哪、怎么动,甚至能模拟绕到瓶子后面看的效果。机器人抓易碎玻璃杯前,先在脑子里“预演”:怎么发力不捏碎?移动时光影对不对?这才是真懂物理,不是靠运气(论文链接:
https://arxiv.org/abs/2510.08673)。
![]()
第二个WorldMEM架构,专治AI的“健忘症”。以前AI生成视频超几秒就崩,房子突然没了、书变没了都是常事。开悟3.0用线性注意力机制,把计算成本从指数级降到线性级,相当于装了“无限记事本”——机器人把书放进书架第二层,十分钟后回来,书还在原地,不会变别的东西。
![]()
现在它能生成长达几分钟的1080P高清视频,静态桌子、动态行人都能精准认,再也不“失忆”了(论文链接:
https://arxiv.org/abs/2504.12369)。对比李飞飞团队的Marble,人家偏静态3D建模,开悟3.0聚焦动态物理交互,推椅子会倒、开冰箱灯会亮,这才是具身智能真需要的。
![]()
![]()
开源+软硬一体
大晓的战略才真叫高。王晓刚这背景就不一般:中科大少年班出身,MIT计算机博士,论文被引超14万次,还兼着香港中文大学教授、商汤董事。
他早就看清行业死结:纯软件公司像“缸中之脑”,有智商没触觉;纯硬件公司“四肢发达”,没认知,都是死路。
![]()
所以大晓走了“第三条路”:自研“具身超级大脑模组”和四足/通用机器人,搭了个“采集-模拟-验证”的闭环。这模式有“飞轮效应”:机器人用得越多,数据越丰富;模型越精准,机器人越好用,跟特斯拉一个道理。
![]()
更绝的是,全球巨头都在筑技术壁垒,大晓却把开悟3.0开源了!现在中国开源AI模型的全球下载份额已经超美国,大晓这波就是要当世界模型领域的“DeepSeek”,把顶尖能力开放给所有开发者。
对中小企业来说,这简直是福音:不用砸钱研发基础模型,直接用开悟3.0做应用,工业质检机器人能快速识别缺陷,家庭护理机器人能掌握帮扶力度,落地门槛一下就低了。
![]()
而且开悟3.0还适配了国产芯片,这格局绝了。现在具身智能正迎来爆发期,政策支持力度越来越大,未来3-5年就是规模化关键期。
开悟3.0的出现,不光让中国抢占了先发优势,更给出了不一样的中国方案:不靠封闭壁垒,靠开源生态拉着全行业一起进步。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.