为什么你的智能音箱总是听不懂人话?Google今天给的答案是把大脑换成Gemini 3.1。
这次更新不是小修小补。摄像头界面重做、AI事件标签优化、语音助手底层模型升级——Google Home正在经历去年大改版后的第一次真正迭代。但问题是:换了个更贵的脑子,智能音箱的体验就能质变吗?
![]()
语音助手终于能听懂复杂指令了?
![]()
Google确认,已加入早期体验通道的Home用户现在就能用上Gemini 3.1。这个模型今年2月就在其他平台上线,但智能音箱一直被排除在外。
官方说法是,Gemini 3.1具备"高级推理能力",能更好理解和执行复杂的多步骤语音指令。Google每次更新Gemini都这么说,但这次确实有测试数据背书。
ARC-AGI-2和Humanity's Last Exam这两项测试,考察的是需要特定领域知识的棘手逻辑问题。Gemini 3.1在这些评估中显示出了进步。不过智能音箱主打的是简短交互,这种能力能迁移多少,Google自己也没打包票。
一个确定的变化是:单次语音指令可以塞多个任务了。以前你得拆成"开灯""调亮度""设场景"三步,现在可以尝试一句话说完。想跟音箱长聊也行,Gemini支持连续对话。
Ask Home走出App,但网页版还是预览
AI驱动的Ask Home功能原本只在手机App里,这次要扩展到网页端。以后你可以在电脑上用自然语言查摄像头历史、创建自动化规则。
Google给这个网页版加了限定词:"near future"(近期推出),而且开头只是"preview feature"(预览功能)。翻译一下:能用了,但别指望稳定。
付费订阅用户能用Ask Home直接生成自动化,免费用户还得老老实实点按钮、选下拉菜单。这个分层策略Google从去年就开始推,现在进一步固化了。
摄像头和AI标签:补去年的作业
2025年的Home App大改版被吐槽不少。摄像头控制反人类,AI通知要么没用、要么报错——这些问题Google自己也不是不知道。
今天的更新专门打了这两个补丁。摄像头 feeds 导航优化,AI事件标签逻辑简化。但Google没提具体改了哪些交互细节,只说"应该更直观"。
AI标签的准确性是老大难。之前系统经常把风吹树叶标成"有人徘徊",把快递车识别成"可疑车辆"。这次优化能不能根治误报,还得看用户实测。
自动化配方多了,但免费用户被挡在门外
Google列了一批新的自动化触发条件和执行动作。完整清单如下:
![]()
• 新触发:设备状态变化、环境传感器阈值、特定时间模式
• 新动作:多设备联动、场景渐变、通知分级推送
但关键门槛没变:用自然语言生成这些自动化,必须是付费订阅者。免费用户只能手动配置,体验差距在拉大。
Google的商业模式很清晰——把AI交互包装成增值服务。但智能家居的基础体验(比如摄像头好不好用、语音助手听不听话)本应是产品底线,现在成了付费解锁的"高级功能"。
换脑之后,智能音箱的瓶颈真的是模型吗?
Gemini 3.1的推理能力确实更强,但智能音箱的体验卡点从来不止于模型。
麦克风阵列的物理限制、多轮对话的上下文丢失、家居场景的网络延迟——这些工程问题不是靠换个大模型就能解决的。Google在公告里强调"advanced reasoning",却对拾音降噪、响应速度只字未提。
更微妙的是用户预期管理。Google说"可以长聊",但谁真的愿意站在厨房里跟音箱辩论哲学?智能音箱的核心场景依然是"开灯""几点了""明天天气"——这些指令不需要AGI级别的推理。
复杂指令支持是个加分项,但前提是基础体验不翻车。如果"打开客厅灯"还会被听成"打开歌厅店",再强的推理能力也是屠龙术。
行业观察:Google在智能家居的AI军备竞赛
Amazon Alexa去年也推了LLM重构,Apple HomeKit则在隐私框架里谨慎试水。Google这次更新,本质是把手机端的Gemini优势向家居场景迁移。
但迁移不等于适配。手机上的长文本理解、多模态交互,在音箱场景里可能是过度设计。Google需要证明的是:Gemini 3.1能让语音助手从"能听懂关键词"进化到"能理解意图"——而不仅是跑分更高。
早期体验通道的用户反馈会是关键指标。如果多步骤指令的执行成功率显著提升,这次换脑才算值回票价。否则,不过是又一轮"模型升级、体验原地踏步"的循环。
智能家居的AI竞赛进入下半场。上半场比的是谁先把大模型塞进设备,下半场要比的是谁能把模型能力转化为用户可感知的体验提升。Google今天迈了一步,但这一步够不够大,月底见分晓。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.