我对聊天机器人已经彻底厌倦了。在文本框里敲提示词,像是在学一门编程语言,就为了完成手机本该自动理解的任务。Google意外泄露的COSMO应用,是近期唯一让我眼前一亮的移动AI思路。
这款助手围绕屏幕上下文构建,能感知你正在做什么,并主动建议下一步操作。5月1日,Google通过官方Play Store账号意外将COSMO上线,数小时内又撤下。随着Google I/O临近,很难不猜测它原本要亮相 keynote。我很好奇Google接下来会说什么。
![]()
体积暴露关键信息
COSMO的体量是第一个重要线索。应用 reportedly 需要1.13GB下载,对普通助手应用来说异常庞大。这很可能源于Gemini Nano。软件似乎内置了Google小型AI模型的本地版本,部分AI运算可在手机端完成,无需发往Google服务器。
但本地AI并非没有代价。若管理不当,直接在手机上运行模型会显著耗电。
泄露的设置中有个"Fulfillment Models"选项,包含三种模式:
• Nano Only:完全本地运行,保障隐私与离线使用
• PI Only:依赖远程Google服务器处理复杂推理
• Hybrid:默认模式,根据任务和处理需求在本地与云端间切换
屏幕感知可能是Google的移动AI突破口
目前在手机上用AI,往往意味着中断手头工作、切换应用、向语言模型详细说明上下文。COSMO的赌注是:手机已经掌握上下文,缺的只是查看权限。
该应用请求Android的AccessibilityService API。Google设计这个系统级接口本用于屏幕阅读器等工具,但在这里,它可能让移动代理获取屏幕显示内容。如果你的消息、浏览器标签或日历可见,COSMO就能利用这些屏幕上下文理解你的行为。
一个 reported 例子是日程安排。当你和朋友短信聊晚餐时,COSMO能识别意图,弹出提示建议将事件加入日历。
权限层面仍有些令人担忧。无障碍访问权限可能暴露大量敏感屏幕内容。若纯云端助手索要这种权限,对多数人而言会过于侵入。COSMO的本地Gemini Nano模型,是这次泄露感觉不那么 creepy 的关键——若能在设备端分析屏幕上下文,至少部分敏感数据可远离Google服务器。
正是这些"无聊"技能让COSMO有趣
Google为COSMO设计了14项技能:
• List Tracker:察觉你在规划某事时,主动建议创建清单
• Document Writer:主动提供文档撰写帮助
(注:原文此处截断,后续技能列表未完整呈现)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.