网易首页 > 网易号 > 正文 申请入驻

人形机器人上麻将桌!北京创企攻克30分钟自主对战难题,翻牌碰杠比人还流畅

0
分享至

机器人前瞻4月27日报道,今天,灵初智能发布了分层端到端VLA+强化学习算法模型Psi-R1。R1能够让机器人基于Chain of Action Thought(CoAT)框架的自主推理系统,在开放环境下进行自主推理决策,完成长程复杂操作。

R1以麻将为场景,展现了机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,还验证了三重复合交互能力,即人-机交互、机-机交互、机-环境交互。

机器人要学会打麻将,难在哪?

  • 机器人需要理解麻将的规则,确保行为符合游戏规则。
  • 机器人还需要制定合理的策略,如根据手牌状态、牌局演变以及对手行为来完成动态策略生成,决定出牌、吃碰杠等操作,涉及大量人机交互、机机交互等动作。
  • 机器人操作需要完成毫米级精度的抓牌、出牌、理牌等灵巧精细动作,这对机器人的长程任务规划、灵巧操作能力提出了巨大挑战。

在视频中,R1让机器人具备了翻牌、碰杠、算牌、协作等核心能力。可以看到,机器人灵巧手攻克了触觉-视觉模态对齐难题,实现100%准确翻起麻将牌。


机器人能够根据牌友的出牌,构建牌局状态机,自主构建碰、杠等策略链,并丝滑地完成碰杠动作。


在长程规划上,机器人能够记得所有人打过的所有的牌,并根据牌桌状况动态规划要打的牌。

两台机器人甚至还会相互配合,不仅仅信息共享,互相“看牌”,还能多机配合递牌,提升胜率。


不同于Pi,Figure等「动作单向决策」机制的VLA模型(仅能完成视觉-语言层面的CoT),灵初智能的R1模型的慢脑输入包括行动Token,构建了首个支持「动作感知-环境反馈-动态决策」全闭环的VLA模型,实现机器人操作的视觉-语言-动作多模态协同的CoAT思维链,且已首度成功验证VLA Test-Time Scaling。

快脑S1专注于操作,涵盖了物体的遮掩抓、物体轨迹约束的操作如拉拉链,工作使用技能泛化如扫码、打电钻,高动态操作如抛接球等。

慢脑S2专注于推理规划S1的操作经过tokenize后,作为S2慢脑的输入,和语言、视觉模态融合,基于Causal VLM自回归架构,实现多模态融合的推理和任务规划。

快慢脑通过Action Tokenizer隐式连接,端到端训练,协同完成长程任务的灵巧操作。

灵初智能R1可以应用于多个场景中,例如泛工业中来料仓检测、成品包装等场景,零售物流中拣选、分拨、补货、打包等场景,以及家庭服务与协作场景

目前,该公司已与制造业、商超零售、跨境物流等行业龙头企业展开合作,梯次布局高价值商业化场景,从泛工业向泛零售物流,再最终迈向家庭应用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本记者爆料,高市早苗外访归来大发雷霆,看来下跪都没求到稀土

日本记者爆料,高市早苗外访归来大发雷霆,看来下跪都没求到稀土

忠诚TALK
2026-05-29 11:13:57
美国一男子半小时内在纽约连杀四名游民,其中包括一名83岁华裔老人,并致另一受害者重伤,因纽约州已废除死刑,凶手被判40年至终身监禁

美国一男子半小时内在纽约连杀四名游民,其中包括一名83岁华裔老人,并致另一受害者重伤,因纽约州已废除死刑,凶手被判40年至终身监禁

三湘都市报
2026-05-29 09:16:24
还敢去全季酒店过夜吗

还敢去全季酒店过夜吗

不正确
2026-05-28 23:04:54
梦碎第25冠!德约燃尽!鏖战4小时53分出局,19岁小将刷新6大纪录

梦碎第25冠!德约燃尽!鏖战4小时53分出局,19岁小将刷新6大纪录

大秦壁虎白话体育
2026-05-30 03:02:45
电车,是时候交养路费了

电车,是时候交养路费了

第一财经资讯
2026-05-29 10:11:25
大坂直美法网再换装,金色战袍外搭象牙裙摆

大坂直美法网再换装,金色战袍外搭象牙裙摆

日常碎碎念啊
2026-05-29 01:18:39
奉劝所有人:退休后,跟别人关系再好,一日游、二日游都行,但千万别尝试长时间一起游,否则早晚会后悔

奉劝所有人:退休后,跟别人关系再好,一日游、二日游都行,但千万别尝试长时间一起游,否则早晚会后悔

背包旅行
2026-05-28 18:04:35
1分2失误!直接离开球馆!2.39亿顶薪彻底砸手里

1分2失误!直接离开球馆!2.39亿顶薪彻底砸手里

篮球教学论坛
2026-05-29 18:03:27
巴萨杀疯了!1亿欧元报价阿尔瓦雷斯,90%敲定B席

巴萨杀疯了!1亿欧元报价阿尔瓦雷斯,90%敲定B席

体坛周报
2026-05-29 19:02:16
37岁车手翻车身亡!家人炮轰组委会:黄金时间救援推诿 还我公道

37岁车手翻车身亡!家人炮轰组委会:黄金时间救援推诿 还我公道

念洲
2026-05-29 21:00:37
83名中国人被抓!中方下达4天通牒,若不交人,菲律宾后果自负

83名中国人被抓!中方下达4天通牒,若不交人,菲律宾后果自负

万物知识圈
2026-05-29 09:40:58
穆罕默德·奥达,“上任即被斩首”

穆罕默德·奥达,“上任即被斩首”

中国新闻周刊
2026-05-29 16:57:49
又检出三聚氰胺?国货塌房?五百多个品牌全慌了?

又检出三聚氰胺?国货塌房?五百多个品牌全慌了?

小红花测评
2026-05-28 21:33:27
襄阳“割四赔五”后续!当事人还原真相,父亲曝更多,官方回应

襄阳“割四赔五”后续!当事人还原真相,父亲曝更多,官方回应

180视角
2026-05-29 13:43:46
这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

这跟不穿有啥区别?戛纳闭幕式,女星下垂、副乳突出,露的好辣眼

天马幸福的人生
2026-05-26 11:05:02
农村老家空心化到了什么程度?连葬礼的流程也已经极度简化了

农村老家空心化到了什么程度?连葬礼的流程也已经极度简化了

合赞历史
2026-05-29 15:08:34
铁了心要灭掉中国?一股可怕力量来了!

铁了心要灭掉中国?一股可怕力量来了!

回京历史梦
2026-05-29 18:33:48
赛力斯高管谈特斯拉FSD入华:FSD模拟的是人类视觉驾驶逻辑 华为乾崑智驾超越人眼

赛力斯高管谈特斯拉FSD入华:FSD模拟的是人类视觉驾驶逻辑 华为乾崑智驾超越人眼

快科技
2026-05-29 15:40:07
国足的损失:徐正源回中超再现神奇表现,亲承曾差点执教国足!

国足的损失:徐正源回中超再现神奇表现,亲承曾差点执教国足!

邱泽云
2026-05-29 23:35:22
空姐的一句大实话,戳穿所有男人的本性,有钱还安分的男人太难得

空姐的一句大实话,戳穿所有男人的本性,有钱还安分的男人太难得

千秋文化
2026-05-27 19:49:01
2026-05-30 05:12:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11933文章数 117088关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
亲子
旅游
教育
公开课

家居要闻

云栖 舒展如流云

亲子要闻

营养师家一周快手学生早餐:10分钟搞定,娃超爱!

旅游要闻

云南文旅数智升级,旅游小镇游客满意度提升超过30%

教育要闻

“不漂亮,还很吓人!”大眼睛艺考生走红,颜值却令网友感到不适

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版