![]()
谷歌推出新型AI模型
谷歌于2025年10月7日发布Gemini 2.5 Computer Use模型,该AI具备通过浏览器界面模拟人类操作的能力。据科技媒体The Verge报道,该模型能执行点击、滚动、输入等操作,直接获取非API接口的网页数据。
技术实现与应用场景
该模型基于视觉理解与逻辑推理能力,可完成表单填写等交互任务。谷歌表示其专为缺乏API的界面设计,目前已应用于AI Mode智能代理功能及自主执行购物任务的Project Mariner研究项目。演示视频显示,该模型能完成"玩2048游戏"或"浏览Hacker News热门话题"等指令。
行业竞争态势
此次发布正值OpenAI在年度开发者大会推出新版ChatGPT应用次日。相较竞品,Gemini 2.5仅支持浏览器环境操作,暂未开放桌面系统控制功能,目前提供13种基础交互指令。开发者现可通过Google AI Studio和Vertex AI平台体验该技术。
(消息来源:The Verge 2025年10月7日报道)
参考链接:
https://www.theverge.com/news/795463/google-computer-use-gemini-ai-model-agents
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.