网易首页 > 网易号 > 正文 申请入驻

Meta收购AI音频新贵WaveForms,创始人曾是GPT-4o语音核心大将

0
分享至

Meta 大手笔的买买买还在继续。

近日,Meta 宣布已收购 AI 音频初创公司 WaveForms AI。据知情人士透露,此次收购旨在增强 Meta 在人工智能音频技术方面的实力,特别是开发能够理解并模仿人类情感的下一代语音交互系统。WaveForms 的创始团队,包括其联合创始人 Alexis Conneau 和 Coralie Lemaitre,将加入 Meta 新成立的 AI 部门超级智能实验室 (Meta Superintelligence Labs)。

WaveForms AI 虽然是一家非常年轻的初创公司,于 2024 年 12 月才刚刚成立,但在短时间内便获得了业界的广泛关注。今年早些时候,该公司宣布完成了由知名风险投资公司 Andreessen Horowitz (a16z) 领投的 4000 万美元种子轮融资,当时的公司估值达到了 2 亿美元。


图丨WaveForms AI(来源:LinkedIn)

该公司的核心业务聚焦于开发能够实时理解和响应语音中情感细微差别的音频大语言模型(Audio-based Large Language Models)。WaveForms 的目标是实现其所谓的“语音图灵测试”,即创造出与人类声音在情感表达和自然度上无法区分的 AI 语音。创始人 Conneau 公开表示,他们的使命是追求“情感通用智能”(Emotional General Intelligence, EGI),旨在建立感觉自然、个性化且极具吸引力的人机连接。

Conneau 认为,虽然 OpenAI、Google 和 Meta 等公司都在追求通用人工智能的智力层面,但 WaveForms 的目标是让 AI 交互变得深度人性化和情感共鸣,其音频语言模型能够捕捉语音中的情感细节,如语调、语气变化和口音,并据此调整其响应方式。例如,由 WaveForms 技术驱动的 AI 教师可以识别学生的挫败感,并相应地以更多的耐心或鼓励来回应。

而实现这一愿景的技术关键在于其提出的“端到端音频语言模型”(end-to-end audio language model)。传统的语音处理通常需要三个独立的 AI 模型协同工作:一个模型负责将用户的语音转录成文本,第二个模型基于文本生成回应,第三个模型再将文本回应转换成语音。而根据 a16z 的介绍,WaveForms 的技术能够通过单一模型完成这全部三项任务,从而显著提升了处理效率和交互的流畅性。此外,该模型还计划融入情感检测功能,使其能够根据捕捉到的用户情绪线索来调整自身的输出方式。

此次收购的主角之一,WaveForms 的联合创始人兼首席执行官 Alexis Conneau,是音频和文本大语言模型领域的顶尖研究者。他此前曾在 Meta 从事音频研究长达近八年,之后又在 OpenAI 领导了 GPT-4o 高级语音模式神经网络的研发工作。正是在 OpenAI 期间,他开发了能够对用户口语进行实时、人性化回复的先进语音模式。另一位联合创始人 Coralie Lemaitre 则曾在谷歌担任广告业务策略师,拥有丰富的商业和产品战略领导经验。


图丨Alexis Conneau(来源:AIM Media House)

对于 Meta 来说,收购 WaveForms 是在 AI 赛道上的一次重要加码。最近几个月,Meta 一直在从 OpenAI、Anthropic、谷歌等对手手中挖来大量 AI 人才。

除了 WaveForms,Meta 上个月还收购了另一家致力于生成逼真、类人声音的 AI 初创公司 PlayAI。同时,公司还聘请了前谷歌杰出研究员、语音 AI 领域的知名专家 Johan Schalkwyk,并由他担任新成立的超级智能实验室的语音技术负责人。

根据 The Information 的报道,Conneau 和 Lemaitre 已作为收购的一部分加入 Meta。虽然具体收购金额尚未披露,但考虑到 WaveForms 在去年 12 月的 2 亿美元估值,以及 Meta 和其他科技巨头为招募顶尖 AI 人才支付的巨额溢价,收购价格可能达到数亿美元。而他们在加入 Meta 后,也将向 Schalkwyk 汇报。

Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 对语音交互的未来抱有极大的期望。他在今年四月的财报电话会议上曾预测:“我们都将拥有一个可以全天候与之交谈的 AI。”然而,Meta 此前在自研大语言模型方面并不顺利。其原计划发布的 Llama 4 模型,就因为在进行类人语音对话方面的能力不及 OpenAI 的模型而被推迟。收购 WaveForms,无疑将为 Meta 补上这一关键短板,其先进的情感化、端到端音频技术有望显著提升 Meta 现有及未来产品的语音交互体验。

可以预见,WaveForms 的技术和人才将被深度整合到 Meta 的各项业务中。其技术可以直接用于改进 Meta AI 聊天机器人的语音功能,使其对话更自然、更富情感。此外,在 Instagram Reels 等视频内容平台,该技术也可以用于开发更高级的语音翻译和配音功能。从长远来看,在 Meta 倾力打造的元宇宙 (Metaverse) 虚拟环境中,能够进行情感交流的逼真 AI 语音将是提升用户沉浸感的关键。

参考资料:

1.https://www.theinformation.com/articles/meta-acquires-ai-audio-startup-waveforms?rc=ayz15n

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山西摔狗反杀案,律师一句话问懵法官:天黑后你敢去案发现场吗?

山西摔狗反杀案,律师一句话问懵法官:天黑后你敢去案发现场吗?

慢半拍sir
2025-11-15 15:15:14
韩国政府宣布:中国排日本前面

韩国政府宣布:中国排日本前面

环球时报国际
2025-11-16 15:34:27
有网友将当下的工作双休日、年假等怎么来的全给讲清楚了

有网友将当下的工作双休日、年假等怎么来的全给讲清楚了

清晖有墨
2025-11-16 13:17:10
指责裁判判罚!中国篮协:朱松玮领衔江苏三人男篮球员禁赛1个月

指责裁判判罚!中国篮协:朱松玮领衔江苏三人男篮球员禁赛1个月

狼叔评论
2025-11-16 21:58:43
高市早苗若继续铤而走险 日本将万劫不复

高市早苗若继续铤而走险 日本将万劫不复

极目新闻
2025-11-16 22:29:28
钱再多有什么用?57岁李克勤家丑曝光!一个败家子毁了全家

钱再多有什么用?57岁李克勤家丑曝光!一个败家子毁了全家

林轻吟
2025-11-14 09:20:39
局势再升级!日方召见我驻日大使,高市早苗危言要“核武力介入”

局势再升级!日方召见我驻日大使,高市早苗危言要“核武力介入”

云鹏叙事
2025-11-15 13:09:29
福特总裁:美国制造业人才短缺,如果战争来临谷歌造不出飞机大炮

福特总裁:美国制造业人才短缺,如果战争来临谷歌造不出飞机大炮

爆角追踪
2025-11-16 12:29:56
高市早苗:独岛是日本固有领土,早晚都得收回!高市又抛惊天言论

高市早苗:独岛是日本固有领土,早晚都得收回!高市又抛惊天言论

娱乐圈的笔娱君
2025-11-16 07:12:49
9-1,葡萄牙直通世界杯,C罗停赛,B费戴帽,内维斯3球+飙世界波

9-1,葡萄牙直通世界杯,C罗停赛,B费戴帽,内维斯3球+飙世界波

侧身凌空斩
2025-11-16 23:54:36
80后已经有1100万人提前下车了。

80后已经有1100万人提前下车了。

爱吃糖的猫cat
2025-11-16 18:27:38
冲刺时刻超燃反超逆转!全运会男子800米:奚枭横破全国纪录夺冠

冲刺时刻超燃反超逆转!全运会男子800米:奚枭横破全国纪录夺冠

全景体育V
2025-11-16 19:59:49
笑掉大牙!雷军喊抵制水军,网友却扒出小米操纵水军被罚记录

笑掉大牙!雷军喊抵制水军,网友却扒出小米操纵水军被罚记录

吃瓜局
2025-11-16 17:42:38
香港失业率创过去3年新高!失业人数已超15万,或将继续恶化

香港失业率创过去3年新高!失业人数已超15万,或将继续恶化

港港地
2025-11-02 15:25:41
日月谭天丨高市早苗猖狂挑衅,台湾舆论痛批其涉台谬论躁进“害台”

日月谭天丨高市早苗猖狂挑衅,台湾舆论痛批其涉台谬论躁进“害台”

环球网资讯
2025-11-16 19:27:43
日本敢不敢先打

日本敢不敢先打

求实处
2025-11-16 00:27:27
卓伟爆了一个新瓜!

卓伟爆了一个新瓜!

八卦疯叔
2025-11-15 10:16:28
日本国内紧急备战,媒体曲解国防部发言,网民叫嚣“出兵中国”

日本国内紧急备战,媒体曲解国防部发言,网民叫嚣“出兵中国”

十三级台阶
2025-11-15 18:14:37
中方发布赴日旅游警告后,日本要求北京给出解释,称关系没变!

中方发布赴日旅游警告后,日本要求北京给出解释,称关系没变!

蛙斯基娱乐中
2025-11-16 11:25:18
鲁尼:和特朗普打高尔夫时周围全是狙击手,还有防核逃生装置

鲁尼:和特朗普打高尔夫时周围全是狙击手,还有防核逃生装置

懂球帝
2025-11-16 17:30:09
2025-11-17 00:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15864文章数 514305关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

央视:若高市早苗死不悔改 日本将万劫不复

头条要闻

央视:若高市早苗死不悔改 日本将万劫不复

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

房产
数码
艺术
亲子
公开课

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

数码要闻

华为鸿蒙HarmonyOS 6.0.0.112版本首曝,支持电脑投平板

艺术要闻

这些获奖摄影作品,简直让人目不暇接!

亲子要闻

一分钟教你判断孩子的咳嗽代表什么

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版