刚听说OpenAI出了个电脑助手,谷歌那边立马甩出个大招,10月8号凌晨,他们直接上线了Gemini 2.5的浏览器操作模型,这东西能自己点鼠标,能自己翻网页,还能自己打字,就像给电脑配了个会动的管家。
![]()
有意思的是,发布时间正好赶在谷歌刚更新完浏览器开发工具之后,像是憋了好久才放出来,和OpenAI的CUA、Claude的同类产品比,三家都让AI直接操作日程,但谷歌这次的测试数据真不弱,WebVoyager里准确率到了88.9%,比OpenAI高出将近两个点,演示里,AI能从宠物网站抓数据填进水疗系统,还能帮人约专家复诊,动作干脆利落,跟干了多年的老员工一样。
![]()
不过网友实测发现这东西不太全能,找维基百科页面很快,要是让它一边查诺贝尔奖官网一边翻译,就直接卡住,而且只能用五分钟,中途不能插手,像刚学编程的人,手生得很。
![]()
谷歌在安全上挺谨慎,这AI每动一步都先拍照想想,再决定下一步,遇到转账这种事就会弹个窗口让你确认,现在它主要会用浏览器,电脑桌面和手机界面还不太熟,大概是怕搞砸了。
![]()
其实想想也正常,现在AI当电脑管家,就跟新手开车一样,直路上跑得顺,一到复杂路口就卡住,跨网站操作得前后连得上,可这正是眼下技术够不着的地方,难怪这些模型都还挂着预览版的标签,不敢随便上线。
![]()
说到底,这波AI抢滩登陆,看着热闹,但键盘鼠标真被自然语言替换了,还得慢慢来,谁也不想家里的电脑,突然被AI搞出个大麻烦。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.