网易首页 > 网易号 > 正文 申请入驻

Gemini 2.5 Pro能力再进化:谷歌推出专用计算机操作模型,让AI智能体丝滑接管UI交互

0
分享至


谷歌刚刚发布了一项更新:正式推出Gemini 2.5计算机使用模型(Computer Use model)

这是一款基于Gemini 2.5 Pro视觉理解与推理能力构建的专用模型,旨在赋予AI智能体(agent)与图形用户界面(GUI)直接交互的能力——就像人类一样进行点击、打字和滚动操作

从今天起,Gemini 2.5计算机使用模型已开放公开预览。开发者可以通过Google AI Studio和Vertex AI中的Gemini API进行访问和构建

https://ai.google.dev/gemini-api/docs/computer-use

https://cloud.google.com/vertex-ai/generative-ai/docs/computer-use

谷歌表示,虽然AI模型可以通过结构化的API与软件交互,但许多数字任务仍需要直接操作图形界面,例如填写并提交表单。为了完成这些任务,AI智能体必须能像人一样浏览网页和应用程序

这种原生填充表单、操作下拉菜单和筛选器等交互元素,以及在登录后进行操作的能力,是构建强大通用智能体的关键下一步

如何工作?

该模型的核心能力通过Gemini API中新增的computer_use工具对外开放,并应在循环(loop)中运行


其工作流程如下:

1.输入:工具的输入包括用户请求、当前环境的屏幕截图以及最近的操作历史。输入时还可以指定排除某些UI操作或加入额外的自定义函数

2.分析与响应:模型分析这些输入并生成响应,通常是一个代表UI操作(如点击或输入)的函数调用。对于购买等特定操作,响应中可能还包含一个请求最终用户确认的步骤

3.执行:客户端代码执行接收到的操作指令

4.反馈与循环:操作执行后,新的GUI屏幕截图和当前URL将作为函数响应发送回模型,重新启动循环

这个迭代过程会持续进行,直到任务完成、发生错误,或因安全响应、用户决策而终止交互

谷歌指出,Gemini 2.5计算机使用模型主要针对Web浏览器进行了优化,同时在移动UI控制任务上也显示出巨大潜力,但尚未针对桌面操作系统级别的控制进行优化

性能

根据谷歌公布的信息,Gemini 2.5计算机使用模型在多个Web和移动控制基准测试中表现出色


其性能优于目前市场上的主流替代方案,并在多个基准测试中实现了领先。在针对Online-Mind2Web的Browserbase测试平台上,该模型在浏览器控制方面实现了领先的质量和最低的延迟


安全

谷歌称,在构建之初就将负责任作为首要原则。能够控制计算机的AI智能体带来了独特的风险,包括用户的有意滥用、意外的模型行为以及Web环境中的提示注入和诈骗。

为此,谷歌采取了多项安全措施:

模型内置安全特性:直接在模型训练中加入了安全功能,以应对三大核心风险。

开发者安全控制:

*   逐步安全服务(Per-step safety service):一个模型外的、在推理时运行的安全服务,用于在模型提议的每个动作执行前进行评估。 *   系统指令(System instructions):开发者可以进一步指定,在执行特定类型的高风险操作前,智能体必须拒绝或请求用户确认。

这些控制措施旨在赋能开发者,防止模型自动完成可能损害系统完整性、危及安全、绕过验证码(CAPTCHA)或控制医疗设备等高风险或有害行为

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场2-0!国际米兰全取三分,5000万欧元身价左后卫,闪耀全场

一场2-0!国际米兰全取三分,5000万欧元身价左后卫,闪耀全场

足球评论qs
2026-02-22 03:51:59
“坏胆固醇”下降10%!Nature子刊:仅连续吃2天燕麦,就能显著降低胆固醇,且效果至少持续6周

“坏胆固醇”下降10%!Nature子刊:仅连续吃2天燕麦,就能显著降低胆固醇,且效果至少持续6周

梅斯医学
2026-02-20 07:53:33
太秀了!为露出卡地亚名贵手表和戒指,合格代言人苏翊鸣手忙脚乱

太秀了!为露出卡地亚名贵手表和戒指,合格代言人苏翊鸣手忙脚乱

安宁007
2026-02-20 03:11:28
多国紧急提醒:“立即离开伊朗”

多国紧急提醒:“立即离开伊朗”

第一财经资讯
2026-02-22 09:40:09
48岁海清近况曝光:低调嫁高中同学,17岁儿子成骄傲

48岁海清近况曝光:低调嫁高中同学,17岁儿子成骄傲

无心小姐姐
2026-02-15 11:34:56
迷你攻导演把玩金丝雀!上春山小生删聊天记录!

迷你攻导演把玩金丝雀!上春山小生删聊天记录!

八卦疯叔
2026-02-21 11:28:41
澳大利亚慌了:西芒杜铁矿石首次运往中国,为何标志着全球里程碑

澳大利亚慌了:西芒杜铁矿石首次运往中国,为何标志着全球里程碑

一路荒凉如歌a
2026-02-22 07:19:15
曼城赢了纽卡,阿森纳就领先两分,但阿森纳还有机会保持优势夺冠

曼城赢了纽卡,阿森纳就领先两分,但阿森纳还有机会保持优势夺冠

新新自圆其说说体育
2026-02-22 07:06:25
场均合砍46分!拥有哈登是奢侈,要为他配好阵容,阿特金森明牌了

场均合砍46分!拥有哈登是奢侈,要为他配好阵容,阿特金森明牌了

巴叔GO聊体育
2026-02-21 15:10:56
乐福一家近照,37岁没退役,场均7分拿底薪,超模妻子为他生2娃

乐福一家近照,37岁没退役,场均7分拿底薪,超模妻子为他生2娃

大西体育
2026-02-21 16:36:42
上海地铁最拥挤的五条打工人专线

上海地铁最拥挤的五条打工人专线

天气观察站
2026-02-21 22:34:26
林丹西班牙过年!别墅贴福字年味浓,全家人与朋友除夕吃海鲜大餐

林丹西班牙过年!别墅贴福字年味浓,全家人与朋友除夕吃海鲜大餐

一纸书谣
2026-02-20 10:08:52
武统、和统都没希望了?台湾军事专家:中国已经走上了第三条路

武统、和统都没希望了?台湾军事专家:中国已经走上了第三条路

余們搞笑段子
2026-02-19 05:03:10
毛主席见到贺子珍哥哥,得知其行政待遇八级,大怒道:这是瞎胡闹

毛主席见到贺子珍哥哥,得知其行政待遇八级,大怒道:这是瞎胡闹

南书房
2026-02-17 11:35:05
“初恋小姐姐”人气为什么比不上“眼镜妹” ?

“初恋小姐姐”人气为什么比不上“眼镜妹” ?

挪威森林
2026-02-21 17:14:20
一票难求!到处爆满!川A大军、渝A大军,大年初五依旧无处可去…

一票难求!到处爆满!川A大军、渝A大军,大年初五依旧无处可去…

火山詩话
2026-02-21 13:51:07
你在体制内捅过的最大篓子是啥? 网友:人怎么能捅这么大的篓子

你在体制内捅过的最大篓子是啥? 网友:人怎么能捅这么大的篓子

带你感受人间冷暖
2026-02-13 10:06:39
特朗普:全球进口关税税率将提高至15%

特朗普:全球进口关税税率将提高至15%

澎湃新闻
2026-02-22 09:54:08
苏翊鸣教练正式辟谣:夺金前并未禁止他谈恋爱 4年前只是开玩笑

苏翊鸣教练正式辟谣:夺金前并未禁止他谈恋爱 4年前只是开玩笑

醉卧浮生
2026-02-21 15:26:39
央行重磅潘石屹再次预判楼市!若无意外,未来楼市或迎3大走向

央行重磅潘石屹再次预判楼市!若无意外,未来楼市或迎3大走向

巢客HOME
2026-02-19 09:15:03
2026-02-22 10:20:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1033文章数 396关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

河北"巧克力钓鱼大爷"因病去世享年75岁 家属发声

头条要闻

河北"巧克力钓鱼大爷"因病去世享年75岁 家属发声

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

时尚
数码
教育
手机
艺术

50岁女性过冬穿搭:有大衣和羽绒服就够了,简约从容才是优雅

数码要闻

2026中国电影票房暂列全球第一;小米17系列进军全球市场

教育要闻

文字素描课 | 优秀作文:装满回忆的树

手机要闻

真我新机海外市场发布,Buds T500 Pro耳机曝光

艺术要闻

这本书法,80%的人无法读懂!网友直言:看到第二字就傻眼!

无障碍浏览 进入关怀版