网易首页 > 网易号 > 正文 申请入驻

OpenAI前CTO创业的模型首秀,与面壁智能「撞车」了

0
分享至



今天,大模型圈再次被点燃,这一次的火花来自前OpenAI应用研究负责人翁荔(Lilian Weng)。她与前OpenAI CTO米拉·穆拉蒂(Mira Murati)联合创立的Thinking Machines Lab(TML)首次公布的技术愿景,直指人机交互的终极形态——一个能与人类进行「全双工」(Full-Duplex)实时对话的AI模型。

然而,当TML那支展示着无缝、主动交互能力的Demo视频在网络上流传时,许多AI领域的从业者却产生了一种强烈的「既视感」——因为TML描绘的那个未来,早在三个月前,就已被中国公司「面壁智能」的MiniCPM-o 4.5以开源的形式,带到了现实。

这不仅是一次简单的「撞车」,更像是一场跨越太平洋的技术共识。它不仅验证了下一代 AI 交互的技术路径,也让我们重新审视中国AI力量在全球创新版图中的位置

一、一场不约而同的交互革命:打破「对讲机」模式

要理解这场技术共识的深刻性,首先要明白TML和面壁智能共同挑战的敌人是什么——延续至今的「回合制」(turn-based)交互范式

从Siri到各类语音助手,再到GPT-4o的语音模式,我们与AI的交流更像是使用一部「对讲机」:你说完,等待「滴」的一声,然后它回应。

这背后是一套名为「语音活动检测」(VAD的机制在主导,它像一个裁判,严格划分着你和AI的发言轮次。这种模式,与人类自然对话中那种你来我往、信息流交织的状态,相去甚远。

而面壁智能与TML的共同洞察是:真正的自然交互,必须打破这种轮次限制,进入一个「全双工」的流式处理时代

  • 面壁智能的先行:这正是面壁智能在2月发布并开源MiniCPM-o 4.5时提出的核心理念。在其技术报告中,面壁智能将目标定义为构建一个能够处理和生成「交错多模态信息」的系统,其核心动机就是摆脱「对讲机」的束缚。
  • TML的愿景:在其博客中,翁荔团队明确指出,要从「回合制」转变为处理平行的输入、输出信息流。AI 应该能一边听你说话,一边看着周围的环境,同时思考并生成回应,甚至在你话音未落时就能捕捉到意图,进行打断或补充。

双方几乎用不同的语言,描述了同一个未来。这标志着,AI交互的下一次范式革命,已经有了清晰的靶心

二、高度重合的技术框架

如果说目标一致是「英雄所见略同」,那么实现路径的高度重合,则让这场技术共识变得无可辩驳。TML与面壁智能,仿佛拿着同一张地图,走向了同一个目的地。

这张「地图」的核心,是一种基于时间对齐的流式处理框架

面壁智能称之为Omni-Flow」框架。其原理是将连续的音视频流,像切香肠一样,切成以毫秒(如200ms)为单位的细小片段。然后,将同一时间片段内的视觉、听觉和已生成的文本token「打包」在一起,形成一个按时间排序的统一序列,喂给大模型。



面壁智能Omni-Flow框架示意图

而TML在其博客中提出的,是「基于时间对齐的微轮次」(Time-aligned micro-turn based)概念。其图示与Omni-Flow 的原理如出一辙:同样是将多模态信息流切碎成带有时间戳的微小单元,然后在一条共享的时间轴上对齐融合。



TML微轮次框架示意图

这种设计的精妙之处在于,它将世界从AI视角下离散的、模态各异的数据,还原成了其本来的面目——一个连续不断、多感官信息交织的整体。

正是基于这一共同的底层架构,两者都实现了两个颠覆性的能力:

  • 让模型自己决定「何时说」:由于信息是连续输入的,模型学会了在对话的「流」中寻找最佳发言时机,彻底摆脱了对VAD的依赖。
  • 实现「主动交互」:模型不再是被动等待指令的机器,而是可以主动与周围的环境进行交互,对环境的变动、人物做出反应。

从革命的目标,到核心的实现框架,再到最终呈现的能力,TML的首秀与面壁智能三个月前的工作,形成了完美的闭环印证。

三、愿景与现实:谁先撞线?

既然技术路线高度一致,那么评判的标尺自然就落在了「执行力」上——谁先将蓝图变成了现实?

答案是清晰的。

  • TML(2026年5月):交付的是一份详尽的技术博客和一支制作精良的Demo视频。它成功地将一个激动人心的技术愿景传递给了世界,但截至目前,它仍是一个「期货」。
  • 面壁智能(2026年2月与4月):交付的是一套完整、开源、可立即上手的技术栈。包括了可部署的模型权重、复现所有工作的源代码、长达数十页的详尽技术报告,以及人人可试玩的在线Demo。它是一个已经可以触摸和使用的「现货」。

MiniCPM-o 4.5技术报告地址:

https://github.com/OpenBMB/MiniCPM-V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

如果说翁荔团队是向世界宣告「我们发现了新大陆」,那么面壁智能则是早在三个月前就已经登陆,并绘制好了海图,甚至向所有后来者开放了港口。

这种「交付」形态的差异至关重要。在大模型技术一日千里的今天,三个月的时间差,以及「概念展示」与「开源实物」之间的鸿沟,足以定义谁是先行者,谁是验证者。

四、一场中国AI的「自我证明」

TML与面壁智能的这次「技术撞车」,与其说是一场竞赛,不如说是一次相互成就。

翁荔以其在全球AI领域的巨大影响力,为这一技术方向带来了聚光灯,让「全双工」AI的概念迅速成为行业焦点。

而面壁智能则以其更早的布局、扎实的工程实现和彻底的开源精神,证明了中国AI团队不仅能跟上世界潮流,更有能力在关键领域领先潮流。

直接的数据佐证就是:面壁智能的MiniCPM-o 4.5在2026年2月就已正式开源,比翁荔TML团队领先了3个月。

未来已来,只是分布尚不均匀。这一次,中国AI团队,有幸站在了更早的时区。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
40架歼-10C+4架空警-500,俄罗斯垄断被打破,北非天空要变天

40架歼-10C+4架空警-500,俄罗斯垄断被打破,北非天空要变天

止戈军是我
2026-07-03 13:03:51
科技股突然暴跌,杭州90后小登破防,哭诉“真的太痛”,炒股9年来最惨的一天,满仓长电科技、兆易创新等科技股

科技股突然暴跌,杭州90后小登破防,哭诉“真的太痛”,炒股9年来最惨的一天,满仓长电科技、兆易创新等科技股

金融界
2026-07-03 12:05:48
官方:纳帅辞去德国主教练一职;将与克洛普展开正式接触

官方:纳帅辞去德国主教练一职;将与克洛普展开正式接触

懂球帝
2026-07-03 18:17:24
赛格国际购物中心虚假破产案

赛格国际购物中心虚假破产案

林孙忠
2026-07-03 20:22:56
小泽玛利亚上节目自曝:曾在中国夜店跳舞30分钟进账100万,没想到从AV界引退后的她竟然改行当了老板...

小泽玛利亚上节目自曝:曾在中国夜店跳舞30分钟进账100万,没想到从AV界引退后的她竟然改行当了老板...

日本物语
2026-07-03 23:48:56
Shams:湖人将艾顿送至奇才,换来哈迪+2个次轮签

Shams:湖人将艾顿送至奇才,换来哈迪+2个次轮签

懂球帝
2026-07-04 01:32:07
4年5600万美元!凯塔确定续约凯尔特人 已成绿军关键轮换

4年5600万美元!凯塔确定续约凯尔特人 已成绿军关键轮换

罗说NBA
2026-07-03 21:39:23
上周面试过了一个候选人,薪资也谈到58k*16了。结果背调的时候,前公司给了句:不建议录用。offer悬了,前司的离职评价真那么重要么

上周面试过了一个候选人,薪资也谈到58k*16了。结果背调的时候,前公司给了句:不建议录用。offer悬了,前司的离职评价真那么重要么

励职派
2026-07-01 22:50:59
国行 iPhone 18 Pro 将首次支持 eSIM 虚拟卡

国行 iPhone 18 Pro 将首次支持 eSIM 虚拟卡

XCiOS俱乐部
2026-07-02 14:38:07
西安赛格事件发酵!今年5月集团董事长赵贵,还在营商座谈会发言

西安赛格事件发酵!今年5月集团董事长赵贵,还在营商座谈会发言

火山詩话
2026-07-02 17:12:32
记者:厄瓜多尔球员遭墨西哥贩毒集团威胁,5名球员被联系

记者:厄瓜多尔球员遭墨西哥贩毒集团威胁,5名球员被联系

懂球帝
2026-07-03 19:03:23
0-3!0-2!短短8小时:世界杯做掉伊朗的2队出局 苍天饶过谁

0-3!0-2!短短8小时:世界杯做掉伊朗的2队出局 苍天饶过谁

叶青足球世界
2026-07-03 13:16:12
中央网信办开展“清朗・网络娱乐团播乱象整治”专项行动

中央网信办开展“清朗・网络娱乐团播乱象整治”专项行动

界面新闻
2026-07-03 09:05:20
FIFA官方证实克罗地亚绝平球无效 球员承认:我头发蹭球+确实越位

FIFA官方证实克罗地亚绝平球无效 球员承认:我头发蹭球+确实越位

我爱英超
2026-07-03 12:12:42
凡是普通人买不起的东西,现在全在塌!

凡是普通人买不起的东西,现在全在塌!

黯泉
2026-07-03 16:52:10
男篮输日本,五大罪人曝光!杨瀚森低迷独狼引众怒,郭士强负全责

男篮输日本,五大罪人曝光!杨瀚森低迷独狼引众怒,郭士强负全责

海阔山遥YAO
2026-07-03 21:44:27
俄罗斯宣布:芬兰已成核打击目标

俄罗斯宣布:芬兰已成核打击目标

每日经济新闻
2026-07-03 17:27:43
失踪近一年后,美国一实验室员工被曝曾参与量子物理项目:让物质“同时存在于两个地方”

失踪近一年后,美国一实验室员工被曝曾参与量子物理项目:让物质“同时存在于两个地方”

红星新闻
2026-07-03 14:00:10
是否需要归化球员?郭士强:我们要靠我们中国人去打所有比赛

是否需要归化球员?郭士强:我们要靠我们中国人去打所有比赛

懂球帝
2026-07-03 22:32:08
里奇·保罗曝:若尼克斯未夺冠,詹姆斯今夏本会加盟

里奇·保罗曝:若尼克斯未夺冠,詹姆斯今夏本会加盟

温柔且自由
2026-07-04 01:25:35
2026-07-04 01:36:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12175文章数 117117关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

美媒询问中方是否接受霍尔木兹海峡收费 外交部回应

头条要闻

美媒询问中方是否接受霍尔木兹海峡收费 外交部回应

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

艺术
手机
亲子
家居
军事航空

艺术要闻

OPPO研发总部地块易主,山子高科“双O”新方案曝光!

手机要闻

手机涨价潮来袭!6大品牌涨价风险逐一盘点

亲子要闻

我们这一大家人在韩国又相聚啦

家居要闻

传奇筑 日常诗

军事要闻

俄大使馆遇袭 2年多遭袭击次数已超25次

无障碍浏览 进入关怀版