由前OpenAI首席技术官Mira Murati去年创立的AI初创公司Thinking Machines Lab,于本周一宣布推出一项名为"交互模型"的技术。简单来说,这是一种可以在你说话时打断你的AI。
![]()
目前,所有AI模型的工作方式都相同:你说话,它倾听;它回应,你倾听。Thinking Machines正试图打破这一模式,通过构建一个能够同时处理用户输入并生成回应的模型,使交互体验更像打电话,而非发短信。
这项技术在专业领域被称为"全双工"通信。该公司表示,其模型TML-Interaction-Small的响应时间仅为0.40秒,与自然人类对话的速度大致相当,同时明显快于OpenAI和谷歌同类模型的响应速度。
不过,这目前仍是一个研究预览版,尚未向公众开放。该公司表示,未来几个月内将推出"有限研究预览版",更广泛的正式发布则计划于今年晚些时候进行。
如何评价这项技术?目前还难下定论。从基准测试数据来看,成绩相当亮眼;而其背后的核心理念——交互能力应当是模型的原生特性,而非后期附加功能——同样颇具吸引力。然而,实际使用体验是否能达到技术层面所宣称的效果,只有等到用户真正上手之后才能见分晓。
Q&A
Q1:TML-Interaction-Small模型的响应速度有多快?和其他模型比怎么样?
A:TML-Interaction-Small的响应时间为0.40秒,与自然人类对话速度大致相当,明显快于OpenAI和谷歌的同类模型。这种速度得益于"全双工"通信技术,使模型能够同时处理用户输入和生成回应。
Q2:全双工AI交互和普通AI对话有什么区别?
A:普通AI对话采用"半双工"模式,即用户说话时AI倾听,AI回应时用户倾听,交替进行,类似发短信。全双工模式则允许AI在处理用户输入的同时生成回应,更接近真实电话通话体验,交互更自然流畅。
Q3:Thinking Machines Lab的交互模型什么时候可以使用?
A:目前该模型仍处于研究预览阶段,尚未向公众开放。据Thinking Machines Lab透露,有限研究预览版将在未来几个月内推出,更广泛的正式版本预计于2025年晚些时候发布。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.