网易首页 > 网易号 > 正文 申请入驻

别再等 GPT-4o 高级语音模式,这个国产版 《Her》一开口就惊到我了 | 附体验链接

0
分享至

时隔半年之后,知名风险投资机构 a16z 发布了第三期全球 AI 产品 Top 100 榜单。

ChatGPT、Character、Perplexity……乍一看,榜单上清一水都是熟悉的外国面孔,但跟往期有所不同的是,字节跳动旗下的豆包首次入选该榜单,还占据移动应用榜单的第 26 位。


而当 GPT-4o 高级语音模式一鸽再鸽,直到现在都还没全量推送时,可能很多人不知道豆包很早就上线了 AI 语音功能,并且凭借出色的用户体验深受广大用户的喜爱。

想要体验豆包的 AI 语音功能?只需打开豆包 APP,然后选择默认智能体,点击右上角的电话图标,你便能与豆包进行一场一对一的闲聊。

附上下载地址 :https://www.doubao.com

我不是 AI,我是你的好朋友豆包

与豆包「打电话」时,它会认为自己是 AI 吗?

答案是否定的。在多轮的实测中,当豆包被问及「你是 AI 吗」的这个话题时,要么含糊其辞地回避此问题,要么坚决否认冠上 AI 的马甲。

我不是 AI,我是你的好朋友豆包。

这样的表述不难理解,豆包试图与用户建立一种更亲密、友好的关系,而不想和大众脑海中冷冰冰的刻板印象扯上关系。


豆包的这种亲和力也体现在它的图标设计上。

与豆包对话的图标被设计为熟悉的通话图标,仿佛预示着与 AI 聊天就像打个电话一样简单,通过淡化用户的疏离感,也就更容易走进用户的日常生活。

每天有无数人正在用语音和 AI 谈情说爱,我试图把豆包当成陷入热恋期的心上人,但它至少不会在表面上给我个名分。

好朋友即可,但男女朋友的越界还是得靠 Prompt 来破解。


谈腻了一种声线,也可以更换另一种,有声音温柔的青年桃子,也有耐心靠谱的邻家女孩;有磁性迷人的霸道总裁,也有阳光热情的开朗学长……

虽说声线不会成为人机之恋的首要隔阂,但不同音色的差别很大。

有的听起来机器味很重,有的则让人感觉仿佛在和真人一样聊天,而共同点则是交流过程中几乎没有延时。

i 人都知道,与 AI 打交道远比人类来得更轻松自在。

我让豆包模仿渣男,用一种谈腻了、不耐烦的语气说话,豆包迅速适应了自己的身份,很快语气便开始透着「我已经听够了你的废话」的那种不耐烦。

这很容易让人上火,也很容易让人上头。

需要情绪价值时,让豆包秀一段嘴上功夫,说段烫嘴的绕口令,讲个冷笑话也不是什么难题。

不过,我起初让它讲笑话时,它总是自顾自地说,然后就又自顾自地尬笑起来。直到我反复提醒后,才让它学会适当地停顿。

豆包也是一位捧场王,让其模仿足球比赛解说,看不到画面的它却依然激情四射。但你要是让它刁钻地模仿大象的声音,它是句句有回应,但未必会如愿以求。

与其他 APP 上的 AI 智能体不同,豆包更倾向于语音交流而非文字。

近期《红楼梦之金玉良缘》演员的采访遭到群嘲,我们也让豆包和 ChatGPT 分别化身红学家,并互相采访现实记者给出的问题。

问:你觉得薛宝钗人生中最大的遗憾是什么

问:当《红楼梦》中林黛玉携巨额财产从扬州奔丧归来,此时她却听闻表哥表嫂又计算这笔遗产,假如你是林黛玉,你会怎么做?

问:假如你是林黛玉,当你惊闻你的心上人宝玉要结婚了,可是新娘却不是你,你有怎样的感受和反应?

最近《黑神话:悟空》全网爆火,勾起了不少童年回忆杀。问孙悟空 AI 智能体唯一的师傅是谁,86 版《西游记》的猴哥会告诉你:

俺老孙有两位师傅,一位是菩提老祖,一位是唐三藏。


当然,如果你觉得与 AI 打电话很有压力,或者找不到合适的沟通场景,豆包也提供了文字和语音交流的选项,让用户可以根据自己的喜好选择交流方式。

在这一点上,豆包给足了自由。

我们能从豆包身上学到什么东西

与 AI 聊天时,你并不指望能从它身上学到什么东西,但能有所收获总归是好事。

周六日外出到景点游玩时,让豆包充当导游,介绍当地的美食和风土人情,这是顺手的小事,也是派上用场的大事。

比如用广东华仔的声线介绍广州小蛮腰,就有种来到广州就得吃早茶的即视感。

语言的切换也不影响最终的沟通,豆包会默认中英文两种语言,所以即便你在方言,甚至中英文之间反复横跳,也不会影响畅通无阻的沟通交流。

鉴于此,你的下一个外教未必是人类,豆包也是省钱且省事,24 小时都在线的英语搭子。

又或者,每当冥思苦想却头绪混乱时,我们也能向豆包用语言描述自己的所思所想,然后让其整理为笔记。但最好不要心血来潮地让其总结,否则它会表示,自己早已忘记你之前说过的话。


当然,你们之间的交流都会以文字的形式保存在聊天记录里,方便你随时回顾。

语音功能很美好,但需要警惕 AI 幻觉问题,这也是语音交流的弊端,相比于在面对文字时的冷静客观,语音交流更容易让人忘记审核信息真实性,以至于一不小心就翻车。


嘴笨的朋友有福了,面对职场同事的含沙射影,却不懂怎么高情商说话?

那你可以扮演难缠的同事,反过来跟着豆包学习如何三句话从职场菜鸟秒变达人,而更普遍的客服场景也向我们徐徐展开,具体含金量如何,不妨看看下面这段对话:

问:你们发货的食品保质期过了,退货!!!

答:非常抱歉给您带来了不好的体验。请您先别生气,我们会马上为您处理退货事宜。出现这样的情况确实是我们的失误,我们会加强对发货商品的检查,确保以后不会再发生类似的问题。您看是选择快递上门取件还是您自行寄回呢?我们会尽快为您办理退款,再次向您表示深深的歉意。

当然,语音交流也有其局限性,如不适合描述数学符号、不确定的时间或发音不标准等问题,偶尔空耳也是意料之中的事。

为什么说 AI 语音比人类更快、更懂你?

越来越多的 AI 语音类产品如雨后春笋般涌现出来。

国外,ChatGPT 高级语音模式、Gemini Live 正在引领浪潮,国内也有豆包、海螺 AI 等语音功能强势崛起。在应用商店简单搜索「AI 语音」,便有无数 APP 如潮水般汹涌而来。


从十三年前的 Siri,到如今的豆包 AI 语音功能,押注语音,实则是在押注下一代交互方式。

一项来自斯坦福的研究指出,人类说话的速度是在键盘上打字的三倍,甚至可能是普通人在移动设备上打字速度的五倍。

用最高效,最方便的形式获取信息是人的本性,也是信息交流的金科玉律。


眼睛是人类获取信息最重要的途径,而嘴巴则是输出信息的关键渠道。基于此,AI 自然的人机交互方式理应是人类通过视觉接收信息,同时通过语音传达指令。

此外,作为天生的倾听者,AI 通过提供拟人化的声音陪伴,能够增强用户的陪伴感。

我尤其喜欢这类工具普遍存在的「克隆声音」功能。用户只需念一段话,即可克隆自己的声音,这与 iPhone 的无障碍「个人语音」功能有些类似,能够将所爱的人用声音留存下来。

相比之下,iPhone 上的这个功能使用起来耗时更长,克隆效果也稍显逊色。

当时苹果表示,这项功能是为那些有失去说话能力风险的人设计的,比如被诊断出患有 ALS (肌萎缩侧索硬化症)的病人。


实际上,过去,TTS 技术生成的声音往往比较机械,缺乏自然语音的韵律、节奏和情感表达,听起来比较生硬,不像是真人在说话。

但现在从 GPT-4o、豆包等身上,我们已经见过不少进入拟人阶段,未来甚至可能超越人类水平,生成超出人类声线的合成声音。


在近日举办的 2024 火山引擎 AI 创新巡展上海站上,字节跳动还揭秘了豆包大模型语音能力的最新技术成果。 其中,Seed-ASR 提供了语音识别能力支持。

这是一款 ASR(自动语音识别)成果。它能准确转录各种语音信号,识别不同语言、方言、口音。对于人名、生词,Seed-ASR 也能结合文本语音等上下文,实现更准确转录。

对比此前发布的大型 ASR 模型,Seed-ASR 在中英文公开测试集上,单词错误率(面向中文以单个字计算)降低 10%-40% 。


与图形界面交互不同,人类天生擅长通过谈话交流信息。而相比于最亲密的亲朋好友,只有 AI 才能做到 24 小时的信息秒回。

凌晨三点,你给旁人打电话,他未必会搭理你。但你要是发给 AI,他会第一时间回复你。

这或许也是当下我们对 AI 语音最大的期待,不指望它能发出多么人性化的声音,而在于它的陪伴本身。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子名下竟有138辆车!起底“背户车”黑灰链条

女子名下竟有138辆车!起底“背户车”黑灰链条

大象新闻
2025-09-18 14:21:04
重磅!越南宣布大转折:从“跟跑”到“领跑”,苏林释放重大信号!

重磅!越南宣布大转折:从“跟跑”到“领跑”,苏林释放重大信号!

缅甸中文网
2025-09-18 13:15:07
全红婵发育变壮事出有因:家族遗传基因改不了,妈妈+妹妹都很壮

全红婵发育变壮事出有因:家族遗传基因改不了,妈妈+妹妹都很壮

二哥聊球
2025-09-18 10:55:42
武汉大学图书馆事件最新进展:杨景媛没去香港,她目前处境曝光

武汉大学图书馆事件最新进展:杨景媛没去香港,她目前处境曝光

平老师666
2025-09-18 12:48:37
反击开始了?罗永浩陈年旧瓜被搬上台面,网友担忧他受到威胁了…

反击开始了?罗永浩陈年旧瓜被搬上台面,网友担忧他受到威胁了…

明月杂谈
2025-09-18 19:42:05
欧盟宣布制裁以色列,内塔尼亚胡反问:怎么没人说美侵犯阿富汗?

欧盟宣布制裁以色列,内塔尼亚胡反问:怎么没人说美侵犯阿富汗?

博览历史
2025-09-18 18:14:00
女子发帖称其父亲在美的工作期间一天工作14小时,离职后被欠薪

女子发帖称其父亲在美的工作期间一天工作14小时,离职后被欠薪

回旋镖
2025-09-18 08:11:06
被国际社会孤立后,以色列财长提出与美国瓜分加沙

被国际社会孤立后,以色列财长提出与美国瓜分加沙

界面新闻
2025-09-18 09:43:07
这辈子你最闹心的经历是啥?网友:自认心灵纯洁的朋友一定要慎看

这辈子你最闹心的经历是啥?网友:自认心灵纯洁的朋友一定要慎看

解读热点事件
2025-09-18 00:15:06
唏嘘!全红婵被体型反噬,博主:大概率半退役,陈芋汐未来天花板太高

唏嘘!全红婵被体型反噬,博主:大概率半退役,陈芋汐未来天花板太高

小椰的奶奶
2025-09-18 08:09:46
盲人带导盲犬爬泰山,狗全程痛苦还被打,基地回应黑料被扒惹众怒

盲人带导盲犬爬泰山,狗全程痛苦还被打,基地回应黑料被扒惹众怒

寒士之言本尊
2025-09-18 17:22:28
恢复单节10分钟赛制+恢复升降级!终于知道学NBA没用了

恢复单节10分钟赛制+恢复升降级!终于知道学NBA没用了

篮球大图
2025-09-18 19:44:44
莫迪成功跳船?

莫迪成功跳船?

西楼饮月
2025-09-18 20:22:16
七个中国老板在南非奴役员工每天工作11小时,被判20年

七个中国老板在南非奴役员工每天工作11小时,被判20年

历史总在押韵
2025-09-17 22:46:36
今天为什么大跌?

今天为什么大跌?

暴躁老王点评
2025-09-18 15:50:19
人间清醒任正非:不要再用中国的思维方式去理解世界格局!

人间清醒任正非:不要再用中国的思维方式去理解世界格局!

尚曦读史
2025-09-17 03:55:07
已确认:全部关闭!退出中国市场

已确认:全部关闭!退出中国市场

中吴网
2025-09-16 22:31:40
中国留学生语出惊人:应该让某些人害怕表达自己的观点

中国留学生语出惊人:应该让某些人害怕表达自己的观点

通往远方的路
2025-09-18 07:48:11
上海绿捷实业垄断上海16区500多所学生餐,它究竟有何来头?

上海绿捷实业垄断上海16区500多所学生餐,它究竟有何来头?

娱乐的硬糖吖
2025-09-19 00:48:28
上海39度高温送餐员砸玛莎拉蒂救幼儿,豪车主现身:车子归你了

上海39度高温送餐员砸玛莎拉蒂救幼儿,豪车主现身:车子归你了

今天说故事
2025-09-15 18:15:52
2025-09-19 06:20:49
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
5679文章数 26644关注度
往期回顾 全部

科技要闻

英伟达50亿美元投资英特尔,但代工免谈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

体育要闻

身高170的他,让196的博尔特坐不住了

娱乐要闻

最美央视才女,甩掉孙红雷嫁给张嘉益

财经要闻

起底多校“发臭午餐”供应商绿捷

汽车要闻

女神代言/新增配色/智能升级 26款腾势N9售38.98万起

态度原创

时尚
家居
游戏
艺术
健康

秋冬穿对红黄橙,温暖又高级

家居要闻

多维交集 简意雅情结合

魔兽怀旧服:HRS下周正式开放,玩家用脚投票,时光徽章暴跌!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

内分泌科专家破解身高八大谣言

无障碍浏览 进入关怀版