![]()
Google Gemini Live的语音系统正在经历一场悄无声息的"身份危机"。过去三个月,超过10种预设语音选项出现了不同程度的音质劣化——从英国腔变成澳洲味,从清亮女声变成沙哑混响,部分用户甚至需要反复重置应用才能暂时"抢救"回原本的音色。
这不是一次简单的更新翻车,而是AI语音合成领域一个被长期忽视的系统性隐患。
事情最早可以追溯到Gemini Live 3.1 Flash Live的推送。但多位用户反馈显示,语音漂移问题早在此次更新前就已存在,且呈现周期性复发特征。一位Reddit用户描述:"上周我的'Capella'还是标准的伦敦腔,这周突然开始把'water'发成'wooder'。"
语音漂移:从"英国管家"到"澳洲背包客"
「Capella」是Gemini Live最早推出的女性英音选项之一,也是此次劣化最严重的案例。实测显示,该语音的预览片段与实际对话体验已出现显著断层:预览中的语速为每分钟145词,实际交互时骤降至110词;音高从F3降至D3,听感从"清晰干练"滑向"慵懒含糊"。
更诡异的是地域特征的随机跳转。同一对话 session 内,Gemini Live可能在三句之内完成"英式→澳式→美式通用"的口音三连变。一位从事语音合成研究的开发者向9to5Google透露,这种现象与模型推理时的温度参数(Temperature)波动有关——当底层大模型更新时,语音生成模块的随机性阈值可能被连带改写。
![]()
Google Support Forums上关于音频瑕疵的投诉也在同步攀升。爆音、电流杂音、呼吸声异常等问题被提及超过200次,但重现率极低,部分用户称"周一出现,周三消失,周五又回来"。
重置应用的"缓刑效应"
目前唯一被验证有效的临时解决方案,是彻底清除Gemini应用数据并重新登录。这一操作能让语音选项短暂恢复至初始状态,但劣化周期通常在48-72小时后重启。有用户戏称这是"语音系统的老年痴呆症"——每次重置都是一次记忆清零,随后缓慢衰退。
一个值得注意的细节是:语音劣化似乎与使用场景强相关。在Android Auto车载模式下调用Gemini Live,或在主界面执行快捷语音指令时,语音稳定性明显优于深度对话场景。这暗示问题可能出在长上下文交互时的语音流式生成(Streaming TTS)环节,而非基础音色库本身。
Google目前尚未就此事发表官方回应。9to5Google的问询邮件截至发稿未获回复。
AI语音的"忒修斯之船"困境
![]()
把Gemini Live的语音系统比作一艘不断更换木板的船,或许能解释用户的焦虑来源。当底层模型从Gemini 1.0 Pro迭代至1.5 Flash,再到即将全面铺开的2.0系列,语音合成模块作为依赖模型输出的"下游组件",其稳定性从未被纳入版本更新的核心考量。
这与OpenAI的GPT-4o语音模式形成有趣对照。后者采用端到端原生音频生成,音色一致性由单一模型保障;而Gemini Live仍沿用"文本→语音"的分层架构,文本模型的每次微调都可能像蝴蝶效应般传导至最终听感。
一位前Google Assistant工程师在Blind论坛匿名评论:「语音团队和产品团队的OKR(目标与关键成果)从未对齐过。前者优化MOS(平均意见分)和词错误率,后者追求功能上线速度,中间隔着一整个组织架构的真空地带。」
用户端的感知则更为直接。Gemini Live的语音定制功能上线时被宣传为"让AI拥有人格",如今却沦为"每周开盲盒"的抽奖体验。一位付费订阅Gemini Advanced的用户在X平台写道:「我为的是那个记得我偏好的声音,不是随机播放的播客主持人。」
语音作为人机交互中最具情感粘性的通道,其稳定性损耗对品牌信任的侵蚀远超功能缺失。当用户开始记录"哪天的哪个声音最好用",AI助手便从工具退化为需要被驯化的对象——这与Google描绘的"无缝智能"愿景背道而驰。
截至3月底,Gemini Live的语音选项库已扩展至20余种,但社区讨论热度最高的帖子标题是《如何永久锁定2024年9月版本的"Nova"音色》。技术迭代的方向与用户挽留的诉求,正在形成一组尴尬的镜像。
如果下一次模型更新让所有人声线都变成同一个"标准美式男中音",你会选择关闭语音功能,还是干脆换一家?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.