网易首页 > 网易号 > 正文 申请入驻

豆包重磅更新!语音对话“更像人” AI应用端或迎来变革

0
分享至

《科创板日报》1月20日讯(编辑 宋子乔) 1月20日,豆包实时语音大模型正式推出。

据介绍,豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话,主要面向中文语境和场景(可进行英语对话,暂不支持多语种;中文范围内,模型也仅支持小部分方言和地方口音的理解和表达,仍有较大进步空间)。

依托于语音和语义联合建模,该模型呈现出接近真人的语音表达水准,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。

打败GPT-4o?

OpenAI的最新大模型GPT-4o的高级语音功能于2025年1月开始全量推出。

值得注意的是,豆包实时语音大模型直接对标GPT-4o。豆包大模型团队介绍称,在外部真实众测中,模型整体满意度较GPT-4o有明显优势,主要体现在:

豆包大模型的语音语气自然度和情绪饱满度远高于后者,尤其情商层面,模型在情感理解、情感承接以及情感表达等方面也取得显著进展,能较为准确地捕捉、回应人类情感信息;
豆包模型贴合中国用户实际需求,发布即上线,有能力直接服务亿万用户,而非停留于演示Demo层面。

整体满意度(以5分为满分)方面,豆包实时语音大模型评分为4.36,GPT-4o为3.18。其中,50%的测试者对豆包实时语音大模型表现打出满分。 如何实现?

低延时流畅交互、拟人化的语气和情绪反馈,是分辨人与机器的两大重要特征。豆包大模型团队如何让语音大模型不再“一听就是AI”?

其团队研发出了一套端到端框架,深度融合语音与文本模态。该框架面向语音生成和理解进行统一建模,最终实现多模态输入和输出效果。

在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现语音与文本能力深度融合和能力涌现。

在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在“智商”与“情商”之间寻求平衡。

更真实的情感陪伴——实时语音AI的价值

实时语音AI的价值体现在哪里?影响最直接是AI情感陪伴。

《科创板日报》实测发现,豆包的语音大模型不仅能感受到你的情感,还自带情绪和情感,可以随时打断对话,互动更加拟人。

真人级语音对话,能提供更为亲和的交互体验和情感价值,AI不再呈现冰冷的“人机感”,其考验的是AI的“人性化”程度,是人类迈向AGI(通用人工智能)的关键里程碑。

可以说,豆包在实时语音交互上的进步展现的是国产AI软件的进步,有望为AI端侧硬件开辟更广阔的空间,如AI语音助手硬件以及AI玩具等。

目前AI产品呈现多模态趋势,最为常见的是语音+文字的多模态交互,伴随Transformer架构对信息处理能力的提升,浙商证券预计,2025年开始会涌现更多综合性多模态交互,将深度结合数据集、文本、音频、视频等实现更高维度的人机交互层级,这对硬件侧主控芯片提出了更多更高的需求。该机构表示,产业链重点标的包括恒玄科技、中科蓝讯、乐鑫科技、星宸科技、瑞芯微、炬芯科技、全志科技等。

而AI玩具可以视作具备面部识别、语音识别、自然语言处理等技术,能够与用户对话的机器人。随着豆包语音大模型为代表的语言模型不断演进,AI玩具的功能将不仅限于对话,而且能够满足个性化、情感需求。广发证券表示,AI玩具赛道兼具教育与陪伴属性,是具有真实需求的AI硬件落地方向,该机构关注实丰文化、汤姆猫、奥飞娱乐、上海电影等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普再次就停战谈判威胁伊朗

特朗普再次就停战谈判威胁伊朗

澎湃新闻
2026-03-26 20:24:03
巨乳性感绑带浑圆大腿!日本格斗游戏劲爆手办预告

巨乳性感绑带浑圆大腿!日本格斗游戏劲爆手办预告

游民星空
2026-03-25 19:48:32
奥迪突然官宣:32.29万起,新车正式上市

奥迪突然官宣:32.29万起,新车正式上市

高科技爱好者
2026-03-25 23:08:37
杜淳老婆太能买了!戴4条金手链录开箱视频,保守估计花了10W+

杜淳老婆太能买了!戴4条金手链录开箱视频,保守估计花了10W+

蒂蒂茱家
2026-03-25 11:56:39
举国之力也找不到完整夏朝,为何?网友的神预言正在被考古证实

举国之力也找不到完整夏朝,为何?网友的神预言正在被考古证实

超人强动物俱乐部
2026-03-26 16:54:48
导弹打击效果显著,为什么伊朗不“梭哈”,要慢慢放以色列的血?

导弹打击效果显著,为什么伊朗不“梭哈”,要慢慢放以色列的血?

Ck的蜜糖
2026-03-24 01:46:13
近期“热播剧”排个名:逐玉倒数,冬去春来第三,第一杀疯了!

近期“热播剧”排个名:逐玉倒数,冬去春来第三,第一杀疯了!

无处遁形
2026-03-26 07:18:10
为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

为啥一听说给农民涨养老金,就有一群人激烈反对?真相太沉重

复转这些年
2026-03-14 23:48:05
我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

大象新闻
2026-03-24 13:53:11
张雪峰突然去世!博士妻子李丽婧饱受非议上热搜,或面临3个选择

张雪峰突然去世!博士妻子李丽婧饱受非议上热搜,或面临3个选择

火山詩话
2026-03-25 16:14:23
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

FM93浙江交通之声
2025-10-28 00:01:43
特朗普拒绝承认对伊朗打击是战争

特朗普拒绝承认对伊朗打击是战争

界面新闻
2026-03-26 15:51:22
南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

白云故事
2025-03-14 19:05:07
伊朗拒绝美国停战方案并提出伊方5项条件

伊朗拒绝美国停战方案并提出伊方5项条件

新京报
2026-03-25 23:58:14
吕迪格:几乎没有比战拜仁更大的挑战了;凯恩是世界前三中锋

吕迪格:几乎没有比战拜仁更大的挑战了;凯恩是世界前三中锋

懂球帝
2026-03-26 21:51:04
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
特朗普希望破灭了,但是福特号航母上4500名美军士兵却彻底安全了

特朗普希望破灭了,但是福特号航母上4500名美军士兵却彻底安全了

安安说
2026-03-26 11:41:14
湖北气温直冲26℃!随后大逆转,外套先别收

湖北气温直冲26℃!随后大逆转,外套先别收

鲁中晨报
2026-03-26 19:57:02
NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

DeepTech深科技
2026-03-25 22:49:10
柯文哲被判重刑,黄国昌蒋万安回应,赖清德又盯上郑丽文?

柯文哲被判重刑,黄国昌蒋万安回应,赖清德又盯上郑丽文?

DS北风
2026-03-26 17:58:06
2026-03-26 23:28:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
700137文章数 1019201关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
教育
房产
公开课
军事航空

这些才是适合春季的穿搭!不沉闷、不单调,大方靓丽又减龄

教育要闻

骂人没有杀伤力?那不是白忙活吗?

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版