![]()
谷歌正在准备让由Gemini驱动的智能体控制用户的Mac电脑,并实现"文件整理"功能,此举旨在与Claude Cowork展开竞争。
目前,Gemini的macOS应用主要包含两项核心功能:一是与网页版相似的原生聊天界面,二是可在任意界面唤出Gemini的快捷键。后者支持用户将当前窗口共享给Gemini,使AI能够获取当前任务的视觉上下文信息。
经过团队对应用安装包的深入解析,谷歌似乎计划通过引入智能体驱动的计算机操控功能,进一步扩展Gemini在Mac上的使用范围。近期体验过Claude Cowork的用户对这类功能应该不陌生——该工具能够直接接管用户电脑,以完成特定任务。
让我们一起高效完成工作
你正在处理什么任务?
从谷歌向Gemini智能体预设的四个示例指令中,可以较为清晰地看出其产品规划:
将我的文件转换为表格
扫描本地文件夹(如发票或报告),提取数据并整理至Google表格。
整理我的文件夹
找出桌面或下载文件夹中杂乱的文件,按类型或内容分类归档。
规范化我的文件命名
读取文件元数据,将数百个命名混乱的文件批量重命名并整理至清晰易读的子文件夹中。
跟进上次会议事项
获取最近一次会议的Meet录音文字稿或文档笔记,并起草一封包含要点和行动项的跟进邮件。
前三个示例指令着重体现了Gemini在Mac上整理本地文件并将其导入Google Workspace应用的能力,这些都是后Claude Cowork时代的基础生产力功能。在底层实现上,这些功能将调用屏幕访问权限及无障碍功能,使Gemini能够查看屏幕内容并控制鼠标和键盘。第四个示例指令则将重心转向Google自有应用生态,涵盖Meet、Docs和Gmail等服务。
综合来看,这些示例指令表明谷歌正致力于让Gemini代替用户完成更多工作。值得关注的是,此次面向macOS的Gemini智能体所具备的能力范围,似乎将超越目前在Android端已开放的功能。目前仅有少数Android设备(如Galaxy S26系列)支持用户指挥Gemini自动执行应用内的简单任务,例如点餐。
相比之下,谷歌显然正准备将macOS版Gemini打造成Claude Cowork的有力竞争者。考虑到谷歌自去年Gemini 2.5 Computer Use预览版起便已着手探索此类智能体功能,此次进展可谓姗姗来迟。对于深度依赖Google Workspace的企业用户而言,Gemini新增的智能体功能无疑是一个令人期待的好消息。
Q&A
Q1:Gemini macOS智能体具体能做哪些文件管理操作?
A:根据谷歌预设的示例指令,Gemini macOS智能体可以扫描本地文件夹并将数据整理至Google表格、对桌面和下载文件夹中的杂乱文件进行分类归档、批量读取文件元数据并重命名为规范格式,以及自动获取会议记录并生成跟进邮件。这些功能依托屏幕访问权限和无障碍功能实现,使Gemini能够直接查看屏幕内容并操控鼠标和键盘。
Q2:Gemini macOS智能体和Claude Cowork有什么区别?
A:两者的核心定位相似,都具备直接接管用户电脑、完成特定任务的能力。目前Claude Cowork已在这一领域建立了先发优势,而谷歌则凭借与Google Workspace深度整合的优势,将Gemini macOS智能体打造为有力的竞争产品。对于已在使用Google Workspace的企业用户来说,Gemini智能体在会议纪要、邮件跟进等场景中的协同体验可能更为流畅。
Q3:Gemini智能体功能在Android端和Mac端有什么差异?
A:目前Android端的Gemini智能体功能较为有限,仅支持部分设备(如Galaxy S26系列)执行应用内的简单自动化任务,例如点餐。相比之下,谷歌为macOS版Gemini规划的智能体能力更为全面,涵盖本地文件管理、数据整理和Google应用联动等多个维度,整体功能范围明显超越当前的Android版本。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.