网易首页 > 网易号 > 正文 申请入驻

OpenAI 前 CTO 的创业模型首秀,与面壁智能「撞车」了

0
分享至

今天,大模型圈再次被点燃,这一次的火花来自前 OpenAI 应用研究负责人翁荔(Lilian Weng)。她创立的Thinking Machines Lab(TML)首次公布的技术愿景,直指人机交互的终极形态——一个能与人类进行「全双工」(Full-Duplex)实时对话的 AI 模型。

然而,当 TML 那支展示着无缝、主动交互能力的 Demo 视频在网络上流传时,许多 AI 领域的从业者却产生了一种强烈的「既视感」——因为 TML 描绘的那个未来,早在三个月前,就已被中国公司「面壁智能」的 MiniCPM-o 4.5 以开源的形式,带到了现实。

先看「边看边听边说」的全模态实时交互效果——

这是 MiniCPM-o 4.5 的效果,模型可以实时观察周围并对环境进行描述输出,主动反应表现一流:

这是 TML 时隔 3 个月后发布的模型效果:

这不仅是一次简单的「撞车」,更像是一场跨越太平洋的技术共识。它不仅验证了下一代 AI 交互的技术路径,也让我们重新审视中国 AI 力量在全球创新版图中的位置。

一场不约而同的交互革命:打破「对讲机」模式

要理解这场技术共识的深刻性,首先要明白 TML 和面壁智能共同挑战的敌人是什么——延续至今的「回合制」(turn-based)交互范式。

从 Siri 到各类语音助手,再到 GPT-4o 的语音模式,我们与 AI 的交流更像是使用一部「对讲机」:你说完,等待「滴」的一声,然后它回应。

这背后是一套名为「语音活动检测」(VAD)的机制在主导,它像一个裁判,严格划分着你和 AI 的发言轮次。这种模式,与人类自然对话中那种你来我往、信息流交织的状态,相去甚远。

而面壁智能与 TML 的共同洞察是:真正的自然交互,必须打破这种轮次限制,进入一个「全双工」的流式处理时代。

面壁智能的先行:这正是面壁智能在 2 月发布并开源 MiniCPM-o 4.5 时提出的核心理念。在其技术报告中,面壁智能将目标定义为构建一个能够处理和生成「交错多模态信息」的系统,其核心动机就是摆脱「对讲机」的束缚。

TML 的愿景:在其博客中,翁荔团队明确指出,要从「回合制」转变为处理平行的输入、输出信息流。AI 应该能一边听你说话,一边看着周围的环境,同时思考并生成回应,甚至在你话音未落时就能捕捉到意图,进行打断或补充。

这是面壁智能的 MiniCPM-o 4.5,打破了传统交互中「对讲机」的模式:

这是 TML 的模型效果:

双方几乎用不同的语言,描述了同一个未来。这标志着,AI 交互的下一次范式革命,已经有了清晰的靶心。

高度重合的技术框架

如果说目标一致是「英雄所见略同」,那么实现路径的高度重合,则让这场技术共识变得无可辩驳。TML 与 面壁智能,仿佛拿着同一张地图,走向了同一个目的地。

这张「地图」的核心,是一种基于时间对齐的流式处理框架。

面壁智能称之为「Omni-Flow」框架。其原理是将连续的音视频流,像切香肠一样,切成以毫秒(如200ms)为单位的细小片段。然后,将同一时间片段内的视觉、听觉和已生成的文本令牌(token)「打包」在一起,形成一个按时间排序的统一序列,喂给大模型。


面壁智能 Omni-Flow 框架示意图

而 TML 在其博客中提出的,是「基于时间对齐的微轮次」(Time-aligned micro-turn based)概念。其图示与Omni-Flow 的原理如出一辙:同样是将多模态信息流切碎成带有时间戳的微小单元,然后在一条共享的时间轴上对齐融合。


TML 框架示意图

这种设计的精妙之处在于,它将世界从 AI 视角下离散的、模态各异的数据,还原成了其本来的面目——一个连续不断、多感官信息交织的整体。

正是基于这一共同的底层架构,两者都实现了两个颠覆性的能力:

从革命的目标,到核心的实现框架,再到最终呈现的能力,TML 的首秀与面壁智能三个月前的工作,形成了完美的闭环印证。

愿景与现实:谁先撞线?

既然技术路线高度一致,那么评判的标尺自然就落在了「执行力」上——谁先将蓝图变成了现实?

答案是清晰的。

MiniCPM-o 4.5 技术报告地址:https://github.com/OpenBMB/MiniCPM-V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

如果说翁荔团队是向世界宣告「我们发现了新大陆」,那么面壁智能则是早在三个月前就已经登陆,并绘制好了海图,甚至向所有后来者开放了港口。

这种「交付」形态的差异至关重要。在大模型技术一日千里的今天,三个月的时间差,以及「概念展示」与「开源实物」之间的鸿沟,足以定义谁是先行者,谁是验证者。

一场中国 AI 的「自我证明」

TML 与面壁智能的这次「技术撞车」,与其说是一场竞赛,不如说是一次相互成就。

翁荔以其在全球 AI 领域的巨大影响力,为这一技术方向带来了聚光灯,让「全双工」AI 的概念迅速成为行业焦点。

而面壁智能则以其更早的布局、扎实的工程实现和彻底的开源精神,证明了中国 AI 团队不仅能跟上世界潮流,更有能力在关键领域领先潮流。

直接的数据佐证就是:面壁智能的 MiniCPM-o 4.5 在 2026 年 2 月就已正式开源,比翁荔 TML 团队领先了 3 个月。

未来已来,只是分布尚不均匀。这一次,中国 AI 团队,有幸站在了更早的时区。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突然爆火!湖北37岁小伙吹气球,半个月赚了60万!

突然爆火!湖北37岁小伙吹气球,半个月赚了60万!

大风新闻
2026-05-12 21:05:08
A股,尾盘传来“一个重大”信号,明天,或将迎来大变盘!

A股,尾盘传来“一个重大”信号,明天,或将迎来大变盘!

夜深爱杂谈
2026-05-12 19:42:14
愤怒!广东“捡瓶小狗”因5年帮主人挣10万元火了!但却因此被毒狗团队盯上…

愤怒!广东“捡瓶小狗”因5年帮主人挣10万元火了!但却因此被毒狗团队盯上…

广东活动
2026-05-11 12:36:44
越来越多的小城市和县城,只剩下体制内经济了!

越来越多的小城市和县城,只剩下体制内经济了!

灯锦年
2026-05-12 21:06:47
知情人士:阿联酋秘密打击伊朗,正式成为参战方,4月初曾袭击伊朗拉旺岛一座炼油厂

知情人士:阿联酋秘密打击伊朗,正式成为参战方,4月初曾袭击伊朗拉旺岛一座炼油厂

每日经济新闻
2026-05-12 21:45:10
U17国足2-0卡塔尔!从垫底升第二 进亚洲杯8强+21年后重返世界杯

U17国足2-0卡塔尔!从垫底升第二 进亚洲杯8强+21年后重返世界杯

侃球熊弟
2026-05-13 02:02:47
从巴萨弃将到阿森纳副队长,用了10年时间,悍将败也巴萨成也巴萨

从巴萨弃将到阿森纳副队长,用了10年时间,悍将败也巴萨成也巴萨

足篮大世界
2026-05-12 18:04:10
"就业难我是不承认的,主要是年轻人不肯吃苦",教授出马一个顶俩

"就业难我是不承认的,主要是年轻人不肯吃苦",教授出马一个顶俩

走读新生
2026-05-12 02:01:01
张柏芝母亲节晒仨儿子, 8岁三胎儿子出镜, 谢霆锋疑似陪同吃饭

张柏芝母亲节晒仨儿子, 8岁三胎儿子出镜, 谢霆锋疑似陪同吃饭

可乐谈情感
2026-05-12 19:26:25
陈都灵,瘦的让人心疼

陈都灵,瘦的让人心疼

陈意小可爱
2026-05-01 10:53:54
女孩演出退礼服社死!嚣张坑惨单位,已被迫停职,更严重的在后面

女孩演出退礼服社死!嚣张坑惨单位,已被迫停职,更严重的在后面

奇思妙想草叶君
2026-05-12 16:49:28
A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

夜深爱杂谈
2026-05-12 19:45:46
晚清最惨绞肉战:七位顶级提督殒命 左宗棠为何三日不眠不食?

晚清最惨绞肉战:七位顶级提督殒命 左宗棠为何三日不眠不食?

掠影后有感
2026-05-10 10:43:55
钱更难挣了!送面条老板哭诉每天送货量减半,旁边一大排店面空置

钱更难挣了!送面条老板哭诉每天送货量减半,旁边一大排店面空置

火山詩话
2026-05-12 13:45:35
彻底不装了!央视拒付天价转播费仅48小时,炸出一堆“牛鬼蛇神”

彻底不装了!央视拒付天价转播费仅48小时,炸出一堆“牛鬼蛇神”

好贤观史记
2026-05-08 16:10:06
阿森纳官方:本-怀特内侧膝关节韧带严重受伤,球员本赛季报销

阿森纳官方:本-怀特内侧膝关节韧带严重受伤,球员本赛季报销

懂球帝
2026-05-12 23:20:08
U17亚洲杯积分榜:中国队逆袭晋级,时隔21年再进U17世界杯

U17亚洲杯积分榜:中国队逆袭晋级,时隔21年再进U17世界杯

烧体坛
2026-05-13 02:01:02
王励勤多次劝说无果!樊振东深夜发声,国乒藏着怎样的现实?

王励勤多次劝说无果!樊振东深夜发声,国乒藏着怎样的现实?

运动探索
2026-05-12 11:08:54
安徽夫妻,卖冲锋衣年入28亿,要IPO了

安徽夫妻,卖冲锋衣年入28亿,要IPO了

创业邦
2026-05-12 14:34:16
76人更衣室彻底乱了!恩比德带头,球员集体倒戈,毒瘤早该离队

76人更衣室彻底乱了!恩比德带头,球员集体倒戈,毒瘤早该离队

你的篮球频道
2026-05-12 07:31:00
2026-05-13 02:28:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69308文章数 656123关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
手机
健康
亲子
公开课

本地新闻

用苏绣的方式,打开江西婺源

手机要闻

WWDC前最后一次大更新!iOS 26.5正式版已发布,升不升看完再说

干细胞能让人“返老还童”吗

亲子要闻

有点东西。周宁运动空间

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版