网易首页 > 网易号 > 正文 申请入驻

不用傻等AI回复了!OpenAI前CTO发布「实时交互模型」,未来新方向?

0
分享至

AIPress.com.cn报道

有没有想过这样一件事,我们跟AI对话的方式,其实很奇怪。

输出一段要求,等它回。它回完,再回复。你等它,它等你。

这样的情况像极了两个人在用对讲机聊天,一方说完,另一方才能开口。

这种回合制的交互方式,已经成了人和AI协作之间最大的障碍。

5月11日,OpenAI前CTO Mira Murati创立的Thinking Machines的AI实验室发布了一项新研究,正面回应这个问题。他们发布了一套名为"交互模型"的系统,其核心只有一个:AI应该像人一样参与进正常对话。

对答式AI的痛点:只能被动等回复

你可能会觉得,现在的大模型已经很厉害了。能写代码、能分析报告、能处理复杂任务。

但如果仔细回想一下日常使用体验,就会发现一个很别扭的地方:

必须把所有需求一次说清楚,才能得到一个符合要求的答案。

因为一旦它开始回答,你就不能插话。它生成内容的过程是封闭的,所以只能等。等它说完,再看有没有偏差,再重新描述需求,再等它重新回答。

这个过程,更像发一封邮件,然后等对方回复。

而现实中,真正高效的协作从来不是这样运作的。在真实的工作场景里,两个人坐在一起解决问题,会随时打断、随时确认、随时调整方向。信息是流动的,反馈是即时的。

Thinking Machines的研究团队认为,这才是问题的根本所在。现在的大模型,大多数在智能上已经很强,但交互方式却依然停留在非常落后的阶段。它们被设计成"等待指令、处理、输出"的线性流程,完全没有为真正的协作留出空间。

提出AI新范式:实时交互模型

Thinking Machines提出的交互模型,核心改变是:把交互能力直接训练进模型本身,而不是靠外部系统拼凑出来。

现在很多看起来"实时"的AI助手,其实是靠一堆外部模块组合实现的。先用一个检测器判断用户说没说完,再把音频传给模型处理,再调用语音合成模块把文字变成声音输出,里面每个环节都有损耗。

Thinking Machines的做法是,从零开始训练一个原生支持实时交互的模型。

技术上,他们设计了一种叫"微交互"的处理机制。



模型每200毫秒处理一小段音视频输入,同时生成200毫秒的输出。输入和输出持续交错运行,不用等你说完,也不用等它答完。

这带来巨大的效果提升:


•可以问它"帮我看看这段代码有没有bug",它可以边看你敲代码边实时给出反馈•你让它给你做俯卧撑计数,它会真的盯着摄像头,每做一个动作喊一个数•甚至可以实现同声传译

⚡ 核心突破

这些能力,在回合制架构下几乎不可能实现。


双模型架构:兼顾实时响应与深度推理

光有"实时"还不够,因为有些任务确实需要深度思考和长链条推理,这和"快速响应"天然是矛盾的。

Thinking Machines的解决方案是把系统拆成两层。


•前台:交互模型,负责实时对话,始终在线,随时响应•后台:推理模型,负责处理复杂任务,比如调用工具、搜索网页、生成长文档、执行多步骤规划

两套模型共享上下文,后台完成一部分任务就把结果传回前台,由交互模型在合适的时机自然融入对话,而不是突然打断某一方。



这像一个配合默契的团队,一个人在前台负责接待,另一个人在后台快速处理,信息随时同步。

测评数据:交互质量和响应速度占优

Thinking Machines公布了一批测评数据。他们的模型在主流实时AI系统的对比中,在交互质量和响应速度两个维度上都处于领先位置。



更有意思的是,他们专门设计了几个针对新型交互能力的测试:

时间感知测试:让模型在你呼吸练习时,每四秒提醒一次吸气和呼气,要求时间精准,内容正确。

视觉主动响应测试:让模型盯着视频,在特定动作发生的瞬间主动开口回答,而不是等你说话。

实时计数测试:让模型通过摄像头统计你做了多少个俯卧撑,实时报出数字。

他们对比了GPT Realtime和Gemini Live等当前主流实时模型。结论是:现有模型在这些任务上几乎无法完成,大多数时候保持沉默,或者给出错误答案。


⚠️ 关键差异

因为这些任务的根本要求是主动感知、主动开口,而不是等待触发、被动响应。


论文坦诚模型不足之处

Thinking Machines在论文里也坦率列出了当前的局限:


•连续的音视频流会快速积累上下文,如果对话时间很长,模型的上下文管理会面临压力•低延迟流传输对网络稳定性要求很高,连接质量差的情况下体验会明显下降•目前发布的是一个276B参数的MoE模型,其中120亿参数处于激活状态•更大规模的版本因为速度问题还没有部署,计划今年晚些时候推出•实时交互场景下的安全性和对齐问题,也是他们正在持续研究的方向
OpenAI前CTO的"复仇者联盟"

Mira Murati曾在OpenAI任职六年半,2022年升任首席技术官,主导了ChatGPT、DALL-E、Codex、Sora等几乎所有明星产品的技术方向。在2023年11月Sam Altman被董事会罢免事件中,Murati曾短暂出任OpenAI临时CEO。2024年9月,她正式宣布离开OpenAI,寻求独立技术探索。

2025年2月,Thinking Machines Lab正式成立。创始团队集结了大批OpenAI核心元老,被业内称为AI行业的"复仇者联盟"。

公司成立仅5个月,便完成20亿美元种子轮融资,由a16z领投,Nvidia、AMD、Jane Street等机构跟投,公司估值达到120亿美元。

成立之后,公司遭遇了多次核心人员流失:2025年10月,联合创始人Andrew Tulloch离职加入Meta;2026年1月,CTO Barrett Zoph离开,联合创始人Luke Metz及核心成员Sam Schoenholz同步回归OpenAI;2026年4月,Meta再次挖走至少7名创始团队成员。

最初的五位联合创始人,最终仅剩John Schulman一人留守。

面对动荡,Mira Murati做出关键决策:将PyTorch创造者Soumith Chintala从Meta招入,并提拔为新任CTO。

即便遭遇大规模创始团队流失,公司仍在成立仅15个月后,推出了这一具有行业定义性的技术Demo。

过去几年,AI能力的竞争集中在一个维度:更聪明。更长的推理链、更强的代码能力、更大的知识库、更准确的输出。

但Thinking Machines的这项工作,指向了另一个可能被低估的领域:AI不只要更聪明,还要更会协作。

AI和人类之间真正的协作,可能才刚刚开始变得可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

蓬勃新闻
2026-05-12 13:02:22
贵州20岁女子因腹痛就医才发现自己怀孕且胎儿已足月,当天平安分娩5斤多女儿;当事人:以为只是月经不调,误将胎动当做正常肠胃蠕动

贵州20岁女子因腹痛就医才发现自己怀孕且胎儿已足月,当天平安分娩5斤多女儿;当事人:以为只是月经不调,误将胎动当做正常肠胃蠕动

台州交通广播
2026-05-11 14:48:35
东契奇官方声明:今夏将与前女友争女儿抚养权 不会参加世预赛

东契奇官方声明:今夏将与前女友争女儿抚养权 不会参加世预赛

醉卧浮生
2026-05-12 14:06:08
疫情向十多国扩散?美国放走汉坦病毒感染者,开始给全世界埋雷?

疫情向十多国扩散?美国放走汉坦病毒感染者,开始给全世界埋雷?

明天见灌装冰块
2026-05-12 21:10:57
体坛震动:中国拒付7倍收视价,FIFA紧急访华

体坛震动:中国拒付7倍收视价,FIFA紧急访华

各生欢喜者
2026-05-12 23:21:22
光明网评论员:摆渡车,不该是景区的钱袋子

光明网评论员:摆渡车,不该是景区的钱袋子

澎湃新闻
2026-05-12 22:24:15
自称持股14万股东替儿子向上市公司求职,沧州明珠:可跟公司联系看有无合适岗位

自称持股14万股东替儿子向上市公司求职,沧州明珠:可跟公司联系看有无合适岗位

红星新闻
2026-05-12 12:07:23
出乎意料!特朗普原定访华计划作废,中方官宣,特意增加停留时间

出乎意料!特朗普原定访华计划作废,中方官宣,特意增加停留时间

黑鹰观军事
2026-05-11 16:30:09
中央定调,2026养老金调整可能性大,月入8000以上涨幅不到1.5%?

中央定调,2026养老金调整可能性大,月入8000以上涨幅不到1.5%?

王五说说看
2026-05-12 06:53:24
人大代表建议机关事业单位双休制调整为“大周休3天,小周休2天”

人大代表建议机关事业单位双休制调整为“大周休3天,小周休2天”

细说职场
2026-05-10 10:34:41
心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理观察局
2026-05-12 09:06:23
市民在上海街边看到“好东西”售价仅35元,最后竟被迫支付了8700!还是假货!果断报警

市民在上海街边看到“好东西”售价仅35元,最后竟被迫支付了8700!还是假货!果断报警

环球网资讯
2026-05-12 14:30:58
杨受成“霸占”容祖儿半生:不娶也不放,她到底图什么?

杨受成“霸占”容祖儿半生:不娶也不放,她到底图什么?

橙星文娱
2026-05-12 15:17:44
性感小黑裙:它不张扬,但它是你的底气

性感小黑裙:它不张扬,但它是你的底气

疾跑的小蜗牛
2026-05-12 22:59:59
揭秘:在开国将军中,让彭老总最欣赏的十位将军,分别都是谁?

揭秘:在开国将军中,让彭老总最欣赏的十位将军,分别都是谁?

史之铭
2026-05-12 20:39:14
伊朗紧急辟谣

伊朗紧急辟谣

陆弃
2026-05-10 09:28:48
郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

林子说事
2026-05-12 19:15:50
刘嘉玲默许梁朝伟在岛国养私生子 !?

刘嘉玲默许梁朝伟在岛国养私生子 !?

八卦疯叔
2026-05-12 10:10:13
彻底撕破脸!央视硬刚天价转播费后,资本报复手段简直不堪入目

彻底撕破脸!央视硬刚天价转播费后,资本报复手段简直不堪入目

微风轻拂面
2026-05-12 01:32:22
美股异动|半导体股回调,高通大跌超8%,三倍做空半导体ETF-Direxion涨超9%

美股异动|半导体股回调,高通大跌超8%,三倍做空半导体ETF-Direxion涨超9%

和讯网
2026-05-12 23:09:03
2026-05-13 00:04:49
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
107291文章数 61755关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

房产
数码
健康
亲子
公开课

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

数码要闻

2000W电源来了!AI工作站供电新选择

干细胞能让人“返老还童”吗

亲子要闻

dhea什么时候吃最好时间?卵巢早衰做试管成功率高吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版