网易首页 > 网易号 > 正文 申请入驻

OpenAI 前 CTO,拿出了一个「最人性」的 AI

0
分享至


Mira Murati 用一年半时间证明了「人机协作」不是一句口号。


作者|桦林舞王

编辑|靖宇

在「蛰伏」了 18 个月后,OpenAI 前 CTO Mira Murati 的新团队,Thinking Machines,终于交出了自己的答卷。

5 月 11 日,Thinking Machines Lab 发布了一段研究预览视频,展示了他们所谓的「交互模型」(Interaction Model)。

这不是又一个大语言模型的发布会,也不是又一轮跑分刷榜。这家公司做的事情,用一句话概括就是——让 AI 不再像发微信一样一条一条回复你,而是像面对面聊天一样,随时听、随时看、随时插嘴。

如果你看过他们的 Demo 视频,你会发现一件有意思的事:用户正在说话的时候,AI 也在说话;用户对着摄像头做俯卧撑,AI 在一旁数数;用户写代码写错了,AI 主动开口提醒——没人让它说话,它自己看到了。

这种体验,当前市场上没有任何一个商业 AI 产品能做到。

01

「回合制」的枷锁

要理解 Thinking Machines 做的事情为什么重要,得先理解当前所有 AI 对话系统的底层逻辑——回合制。

你说一句,AI 等你说完,然后回一句。在你说话的时候,AI 是「瞎」的、「聋」的,什么都感知不到。在 AI 回复的时候,它的感知也冻结了,不接收任何新信息。这就像两个人隔着一堵墙用对讲机沟通,你按下说话键的时候对方只能等着。

Thinking Machines 介绍 Demo|图片来源:YouTube

这套逻辑在打字聊天的场景下勉强够用,但一旦涉及语音、视频、实时协作,问题就暴露了。现有的 AI 模型把「自主工作」当作最重要的能力来优化,结果是人越来越难留在循环中。

Anthropic 自己的模型卡里都承认过,用户如果用同步、实时的方式操作他们的模型,体验反而不好——模型太慢,用户感知不到价值。

Thinking Machines 的核心主张很简单:交互能力应该和智能一起扩展,而不是被当成事后补丁。

02

200 毫秒的「微回合」

Thinking Machines 的技术路线有一个核心设计:时间对齐的微回合(Time-Aligned Micro-Turns)。

传统模型的输入和输出是一整段一整段处理的。而他们的交互模型把时间切成了 200 毫秒一个单位——每 200 毫秒处理一段输入,同时生成一段输出。音频、视频、文本,三条流同时进行,交替编织成一个连续的 token 序列送给模型。

这意味着什么?模型不再有「你说完了我再说」的人为边界。它可以在用户说话的时候插嘴、可以边听边做搜索、可以一边看视频一边出声提醒。这些能力在以前需要用外部组件拼凑——一个 VAD(语音活动检测)判断什么时候该打断,一个 TTS 生成语音——而 Thinking Machines 把这一切都训练进了模型本身。

他们的逻辑很明确:如果交互能力写在模型外面的「脚手架」上,那模型变大、变聪明的时候,交互能力不会跟着变好。只有把交互训练进模型,扩展模型才能同时让它更聪明、也更会协作。Rich Sutton 那篇经典的「苦涩的教训」(The Bitter Lesson)说的就是这个道理——手工设计的系统,终将被通用能力的规模化击败。


在交互中搜索并生成图表|图片来源:YouTube

在 Demo 视频中,有一个细节让人印象深刻:用户在和 AI 对话的过程中,AI 同时在后台搜索网页并生成 UI 图表,然后无缝地把搜索结果织入对话。用户甚至没有注意到 AI 在搜索,以为它全凭自己的知识在回答。这种「一边聊天一边干活」的能力,正是微回合架构带来的直接结果。

03

架构的两层:

一个管交互,一个管深度思考

Thinking Machines 的系统并不只有一个模型,而是分成了两层。

表层是「交互模型」一直在线,持续和用户保持双向交流

底层是「背景模型」,负责需要深度推理、调用工具、执行长链条任务的工作。交互模型在对话中遇到需要深入思考的问题时,会把任务委托给背景模型,同时继续保持和用户的对话——回答追问、接受新输入、维持对话线索。等背景模型出了结果,交互模型会选择一个合适的时机把结果织入对话,而不是生硬地打断用户。

这个设计的精妙之处在于:用户同时享受到了「即时响应」和「深度智能」,不用在两者之间做选择。在技术报告中,他们的 TML-Interaction-Small 模型是一个 276B 参数的 MoE 架构,活跃参数 12B。在 FD-bench V1.5 这个交互质量基准测试上拿到了 77.8 分,几乎是 GPT-realtime-2.0(46.8 分)的两倍。对话响应延迟只有 0.40 秒,而 GPT-realtime-2.0 是 1.18 秒,Gemini 是 0.57 秒。

更有意思的是他们自己开发的几个新测试。一个叫 TimeSpeak,测试模型能否在用户指定的时间主动说话,他们拿到了 64.7% 的准确率,而 GPT-realtime-2.0 只有 4.3%。一个叫 CueSpeak,测试模型能否在正确的语义时机开口,他们拿到 81.7%,GPT 是 2.9%。

换句话说,当前市面上的商业模型,基本上不具备这些交互能力。

04

Thinking Machines 艰难来路

Thinking Machines 的故事,某种程度上也是 OpenAI 人才战争的一个缩影。


Mira Murati 曾经是 OpenAI 的 CTO|图片来源:Techfundingnews

CEO Mira Murati 在 OpenAI 工作了六年半,2022 年升任 CTO,主导了 ChatGPT、DALL-E、Codex、Sora 等几乎所有明星产品的技术方向。2023 年 11 月 Sam Altman 被董事会罢免的那几天,Murati 还当了几天临时 CEO。2024 年 9 月,她宣布离开 OpenAI,说要「给自己留出时间和空间做自己的探索」。

五个月后,2025 年 2 月,Thinking Machines Lab 正式成立。一起来的阵容堪称 AI 行业的「复仇者联盟」——Barrett Zoph(OpenAI 前研究 VP)、John Schulman(OpenAI 联合创始人、RLHF 的关键推动者,此前曾短暂去过 Anthropic)、Lilian Weng(OpenAI 前 VP)、Luke Metz、Andrew Tulloch。顾问团队里有 Bob McGrew(OpenAI 前首席研究官)和 Alec Radford(GPT 系列论文的核心作者)。

公司成立五个月就完成了 20 亿美元的种子轮融资,a16z 领投,Nvidia、AMD、Jane Street 等跟投,估值 120 亿美元。

但接下来发生的事,恐怕是 Murati 没有预料到的。

2025 年 10 月,联合创始人 Andrew Tulloch 离开加入 Meta。2026 年 1 月,更大的震荡来了——CTO Barret Zoph 被公司「分道扬镳」,联合创始人 Luke Metz 和另一位核心成员 Sam Schoenholz 也同时回归 OpenAI。Murati 的公告措辞克制,只提了 Zoph 的离开。58 分钟后,OpenAI 应用部门 CEO Fidji Simo 在社交媒体上宣布同时欢迎三人回归。到了 2026 年 4 月,Meta 又挖走了至少七名创始团队成员。

原来的五位联合创始人,只剩下了一个——John Schulman。

但 Murati 做了一个关键决定:把 PyTorch 的创造者 Soumith Chintala(从 Meta 加入)提拔为新 CTO。

一个失去了大半创始团队的公司,在成立仅 15 个月后拿出了一个定义性的技术 Demo。这本身就说明了一些问题。

05

不只是 Demo,是一种技术信仰

Thinking Machines 这次展示的「交互模型」,当然还有很多局限——长时间对话的上下文管理、对稳定网络连接的依赖、模型规模暂时还不够大(当前版本的更大预训练模型还太慢无法部署)。他们自己在技术博客里坦诚地列出了这些问题。

但这个 Demo 传递出的信号远比技术细节更重要。

当整个行业都在追求更自主的 AI Agent、更长的推理链、更强的自主完成任务的能力时,Thinking Machines 旗帜鲜明地提出了一个不同的方向:AI 应该让人类更容易留在循环中,而不是把人推出去。

他们的技术博客里引用了经济学家哈耶克 1945 年的经典论述——真正重要的知识,往往是关于「特定时间和地点的具体情境」的知识,这种知识很难被完全形式化地传达给 AI。

换句话说,用户脑子里的东西,往往比他们能在 prompt 里写出来的要多得多。要让这些知识流入 AI 的决策过程,唯一的办法就是让人和 AI 的沟通带宽足够大。

从一家经历了联合创始人出走、被 Meta 围猎、被外界质疑产品方向的公司里,跑出了 2026 年第一个让人真正觉得「AI 交互方式要变了」的产品原型。

这或许说明,在 AI 这场竞赛里,最稀缺的资源不是算力、不是资金,而是一个清晰且有信念的技术方向。

*头图来源:YouTube

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你认为这个 Demo 演示如何?


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《GTA6》双平台画质引热议!评论区玩家已吵翻

《GTA6》双平台画质引热议!评论区玩家已吵翻

游民星空
2026-05-11 17:05:22
日本人怒骂张本智和:和松岛辉空都是废物,户上直接被教练开骂

日本人怒骂张本智和:和松岛辉空都是废物,户上直接被教练开骂

何蕥室内设计
2026-05-11 16:08:35
毛主席遗体防腐每年耗费巨资,永久保存水晶棺纯度高达99.9999%

毛主席遗体防腐每年耗费巨资,永久保存水晶棺纯度高达99.9999%

时分秒说
2026-05-07 16:00:09
皇马银河战舰崩塌内幕:喝酒的巨星、嫉妒的劳尔、管就下课的教练

皇马银河战舰崩塌内幕:喝酒的巨星、嫉妒的劳尔、管就下课的教练

老曁科普
2026-04-20 21:28:34
难以置信!网传大学教授点外卖被骑手教育,反怼其“提鞋都不配”

难以置信!网传大学教授点外卖被骑手教育,反怼其“提鞋都不配”

火山詩话
2026-05-11 16:17:16
陈布雷拜读论持久战后感叹道:毛公若在南京主政,蒋公无立身之地

陈布雷拜读论持久战后感叹道:毛公若在南京主政,蒋公无立身之地

睡前讲故事
2026-04-21 11:38:12
美贸易代表大放厥词,不许中方还手?商务部仅用一招,就打懵美国

美贸易代表大放厥词,不许中方还手?商务部仅用一招,就打懵美国

绝对军评
2026-05-12 08:11:46
班主任的大实话:初中是孩子变坏最快的三年,务必抓好这7件事!

班主任的大实话:初中是孩子变坏最快的三年,务必抓好这7件事!

户外阿毽
2026-05-10 19:24:03
歌手黄霄云演出后两次晕倒确诊耳石症!连夜赶路连唱9首,工作室强制停工

歌手黄霄云演出后两次晕倒确诊耳石症!连夜赶路连唱9首,工作室强制停工

TVB的四小花
2026-05-11 13:59:18
出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

霹雳炮
2026-03-14 22:49:47
这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

阿凫爱吐槽
2025-12-17 17:24:39
十大元帅中真正拉起一支队伍的,仅有两个半,他们被我们称为老总

十大元帅中真正拉起一支队伍的,仅有两个半,他们被我们称为老总

史之铭
2026-04-18 03:41:39
性欲越强,寿命越短?这4个生理冷知识,男女最好早点知道

性欲越强,寿命越短?这4个生理冷知识,男女最好早点知道

健康科普365
2026-04-29 16:25:07
哈登24+11创纪录,米切尔单节21分比肩詹皇,骑士25-0击溃东部第1

哈登24+11创纪录,米切尔单节21分比肩詹皇,骑士25-0击溃东部第1

钉钉陌上花开
2026-05-12 10:40:11
四川邻水一婴儿疑似遭家人遗弃,还留有现金和生日,警方回应:婴儿已被家人带回家,并非遗弃,具体原因不便透露

四川邻水一婴儿疑似遭家人遗弃,还留有现金和生日,警方回应:婴儿已被家人带回家,并非遗弃,具体原因不便透露

台州交通广播
2026-05-11 23:10:04
六台:大巴黎接触阿尔瓦雷斯,马竞的起始要价高于1.5亿欧

六台:大巴黎接触阿尔瓦雷斯,马竞的起始要价高于1.5亿欧

懂球帝
2026-05-12 09:13:08
“台湾永远不是中国的?” 郑丽君放狂言,被67岁艺人当众扇耳光

“台湾永远不是中国的?” 郑丽君放狂言,被67岁艺人当众扇耳光

橙星文娱
2026-05-10 13:42:19
汪小菲飞抵台北过母亲节,玥儿姐弟罕露面,一家人游公园好惬意!

汪小菲飞抵台北过母亲节,玥儿姐弟罕露面,一家人游公园好惬意!

娱乐团长
2026-05-11 16:47:41
17岁少年去退货玩具枪,义警却以为他要抢劫?!自诩正义直接给少年崩了...

17岁少年去退货玩具枪,义警却以为他要抢劫?!自诩正义直接给少年崩了...

英国那些事儿
2026-05-11 23:21:15
漫步者30周年限量典藏款音箱官宣,5月13日开售

漫步者30周年限量典藏款音箱官宣,5月13日开售

IT之家
2026-05-11 19:08:07
2026-05-12 12:07:00
极客公园
极客公园
让最棒的创新成为头条
12038文章数 78879关注度
往期回顾 全部

科技要闻

纳德拉法庭爆料:拒当“AI时代的IBM”

头条要闻

李连杰公开回应病情:因患甲亢改变面容 眼球突出来了

头条要闻

李连杰公开回应病情:因患甲亢改变面容 眼球突出来了

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

刘涛晒妈祖诞辰活动照 评论区变许愿池

财经要闻

特朗普要来了,我们且淡定

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
数码
旅游
家居
公开课

教育要闻

吴非:班主任只需要在学生需要时出现,而不是……

数码要闻

国产内存新里程碑:神可自主研发DDR5 RDIMM实现大规模量产

旅游要闻

自然与情绪价值,赋能芬兰旅游中国市场新增长

家居要闻

极简主义下的居住场域与空间

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版