Thinking Machines Lab发布能边说边听的AI交互模型|速度|双工|lab|实时语音模型|machines|thinking

Thinking Machines Lab发布能边说边听的AI交互模型

2026-05-12 22:10:13　来源: 至顶科技

北京举报

分享至

由前OpenAI首席技术官Mira Murati去年创立的AI初创公司Thinking Machines Lab，于本周一宣布推出一项名为"交互模型"的技术。简单来说，这是一种可以在你说话时打断你的AI。

目前，所有AI模型的工作方式都相同：你说话，它倾听；它回应，你倾听。Thinking Machines正试图打破这一模式，通过构建一个能够同时处理用户输入并生成回应的模型，使交互体验更像打电话，而非发短信。

这项技术在专业领域被称为"全双工"通信。该公司表示，其模型TML-Interaction-Small的响应时间仅为0.40秒，与自然人类对话的速度大致相当，同时明显快于OpenAI和谷歌同类模型的响应速度。

不过，这目前仍是一个研究预览版，尚未向公众开放。该公司表示，未来几个月内将推出"有限研究预览版"，更广泛的正式发布则计划于今年晚些时候进行。

如何评价这项技术？目前还难下定论。从基准测试数据来看，成绩相当亮眼；而其背后的核心理念——交互能力应当是模型的原生特性，而非后期附加功能——同样颇具吸引力。然而，实际使用体验是否能达到技术层面所宣称的效果，只有等到用户真正上手之后才能见分晓。

Q&A

Q1：TML-Interaction-Small模型的响应速度有多快？和其他模型比怎么样？

A：TML-Interaction-Small的响应时间为0.40秒，与自然人类对话速度大致相当，明显快于OpenAI和谷歌的同类模型。这种速度得益于"全双工"通信技术，使模型能够同时处理用户输入和生成回应。

Q2：全双工AI交互和普通AI对话有什么区别？

A：普通AI对话采用"半双工"模式，即用户说话时AI倾听，AI回应时用户倾听，交替进行，类似发短信。全双工模式则允许AI在处理用户输入的同时生成回应，更接近真实电话通话体验，交互更自然流畅。

Q3：Thinking Machines Lab的交互模型什么时候可以使用？

A：目前该模型仍处于研究预览阶段，尚未向公众开放。据Thinking Machines Lab透露，有限研究预览版将在未来几个月内推出，更广泛的正式版本预计于2025年晚些时候发布。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

汽车要闻

手机 / 数码

房产 / 家居

Thinking Machines Lab发布能边说边听的AI交互模型

美国放行，Anthropic两款顶级模型将恢复

老人获帮助后车祸去世 孙子:视频里他笑得合不拢嘴

老人获帮助后车祸去世 孙子:视频里他笑得合不拢嘴

德国足球，脸都不要了

罗晋大孤山素颜照，秃顶白发引热议

新氧贷款：宣传年化15%，实际顶格24%

奇瑞风云A9探店 五个理由一定来看看

态度原创

隔代育儿有矛盾？这样沟通，一家人和和睦睦

高中英语平时120左右，遇到瓶颈上不去，如何稳定在一百三四十？

Meiinpsn的穿衣风格，清新又叛逆

突发！万亿资本巨头，悄悄杀入海棠湾！

老人获帮助后车祸去世孙子:视频里他笑得合不拢嘴

老人获帮助后车祸去世孙子:视频里他笑得合不拢嘴

奇瑞风云A9探店五个理由一定来看看