网易首页 > 网易号 > 正文 申请入驻

全面屠榜!谷歌最强编程模型提前释出,碾压Claude 3.7

0
分享至

谷歌史上最强编程模型来了!

智东西5月7日消息,北京时间5月6日晚,谷歌DeepMind AI研究部门正式推出Gemini 2.5 Pro “I/O”特别版,回应开发者社区对实际编程和界面设计效能的强烈需求,给全球用户提前“尝鲜”。

WebDev Arena Leaderboard基准测试最新榜单显示,自2022年底ChatGPT引爆生成式AI竞赛以来,谷歌首次在关键编程基准测试中超越Claude,实现全面领先。新版模型代号“Gemini-2.5-pro-preview-05-06”已取代03-25版本,目前可通过Gemini API、Vertex AI、AI Studio平台获取,普通用户可以通过Gemini聊天机器人应用体验。

▲数据来源于Imarena.AI

新模型定价与Gemini 2.5 Pro模型相同,每百万token输入和输出费用分别为1.25美元和10美元(约合人民币9元和72元)(支持20万token上下文),相较Anthropic的Claude 3.7 Sonnet模型的3美元和15美元(约合人民币22元和108元)更具性价比。

谷歌DeepMind首席执行官戴密斯·哈萨比斯(Demis Hassabis)在海外社交媒体X平台盛赞其为“我们迄今构建的最强编程模型”。

一、编程能力首次超越Claude,AI编程“头把交椅”或将易主

这次的特别款是三月发布的大热模型Gemini 2.5 Pro的升级新版本,谷歌Gemini API高级产品经理Logan Kilpatrick在技术博客中确认,本次升级重点优化了函数调用功能,降低错误率并提升触发可靠性。据谷歌博客内容,Gemini 2.5 Pro“I/O”特别版在编程和构建交互式网页应用方面的能力有“显著”提升,在代码转换(即修改代码以实现特定目标)等任务上的表现也更好。

▲数据来源于WebDev Arena Leaderboard

博客文章中提到了Gemini 2.5 Pro“I/O”特别版在WebDev Arena Leaderboard基准测试(衡量模型创建美观且功能完备的网页应用的能力)中的表现。在最新排名中,Gemini 2.5 Pro Preview (05-06)以1419.95分超越Claude 3.7 Sonnet(1357.10分)登顶,相较前代03-25版本1272.96分的表现,新版实现了146.99分的提升。

谷歌DeepMind首席执行官哈萨比斯对此十分自豪,还狠狠“凡尔赛”了一番:

此外,本次升级最突出的能力在于根据单条文本提示生成完整交互式网页应用或模拟程序。Gemini应用内的演示显示,用户可将视觉图案或主题提示直接转化为可用代码,大幅降低设计导向型开发者的入门门槛。

二、视频理解超强,领跑视觉基准测试

Gemini 2.5 Pro“I/O”特别版在视频理解方面也具备超高性能,谷歌在其博客中称该版本在VideoMME基准测试中获得84.8%的分数,占据榜首。据谷歌官方博客透露,该模型还驱动着Gemini移动应用的Canvas画布等核心功能。

▲数据来源于Imarena.AI

在Gemini 95等应用中,新模型能自动统一视觉元素的风格匹配。其工作流支持将YouTube视频转化为功能完备的学习应用,并可快速生成响应式视频播放器、动态听写界面等高度风格化组件,几乎无需手动编写CSS代码。

结语:谷歌Gemini模型向实用生产力工具转型

AI编程工具企业Cursor的首席执行官Michael Truell透露,内部测试显示Gemini 2.5 Pro“I/O”特别版的工具调用失败率显著下降。目前Cursor已将Gemini 2.5 Pro集成至其code agent系统。

代码托管平台公司Replit的总裁Michele Catasta也评价称该模型是“平衡性能与延迟的最先进模型”。

虽然谷歌未公开Gemini 2.5 Pro的架构细节,但其核心目标始终是提供更快速、更直观的开发体验。通过强化代码生成和多模态输入优势,Gemini 2.5 Pro正从研究性创新转向解决实际编程挑战的生产力工具。此次提前发布让谷歌DeepMind在重大会议前满足开发者需求、保持市场势头的意图更加明确。

来源:TechCrunch,VentureBeat,Google Blog,Imarena.AI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
以青春之姿 赴千年之约 龙门青年文保人守护石刻瑰宝

以青春之姿 赴千年之约 龙门青年文保人守护石刻瑰宝

新华社
2026-05-03 11:56:18
亨通光电,签下200亿订单!

亨通光电,签下200亿订单!

投研邦V
2026-05-03 19:42:13
退役3年 38岁前皇马巨星形象全毁:发福大肚腩 如同60岁

退役3年 38岁前皇马巨星形象全毁:发福大肚腩 如同60岁

叶青足球世界
2026-05-02 15:22:52
可能ACL!!!大帝太悲壮了!希望没事!!

可能ACL!!!大帝太悲壮了!希望没事!!

柚子说球
2026-05-03 17:37:00
AI生成《黑神话:潘金莲》美图 性感风骚的美人

AI生成《黑神话:潘金莲》美图 性感风骚的美人

3DM游戏
2026-05-01 06:10:08
别再被车企忽悠了!128线到896线激光雷达,差别居然这么大。

别再被车企忽悠了!128线到896线激光雷达,差别居然这么大。

芭比衣橱
2026-05-03 20:47:33
广东八强将战北京!赛程正式出炉,首战时间确认,赵睿首战老东家

广东八强将战北京!赛程正式出炉,首战时间确认,赵睿首战老东家

多特体育说
2026-05-04 00:35:03
这下玩大了,美国单方宣布访华日程,外交部第二天只甩出来一句话

这下玩大了,美国单方宣布访华日程,外交部第二天只甩出来一句话

爱下厨的阿酾
2026-05-03 21:39:12
董洁直播间炸了。几万人盯着一条裙子,没人喊321上链接一片寂静

董洁直播间炸了。几万人盯着一条裙子,没人喊321上链接一片寂静

蒂蒂茱家
2026-05-03 14:46:40
076“四川舰”对比法国的“戴高乐号”,扮猪吃老虎是吧!

076“四川舰”对比法国的“戴高乐号”,扮猪吃老虎是吧!

Ck的蜜糖
2026-05-03 20:49:14
3-0!阿森纳拒崩盘 6分领跑多4个净胜球 曼城压力陡增 9天3场恶战

3-0!阿森纳拒崩盘 6分领跑多4个净胜球 曼城压力陡增 9天3场恶战

我爱英超
2026-05-03 06:35:39
美国国务院宣布:批准向以色列、阿联酋、卡塔尔和科威特的86亿美元巨额军售!且不需国会审查

美国国务院宣布:批准向以色列、阿联酋、卡塔尔和科威特的86亿美元巨额军售!且不需国会审查

鲁中晨报
2026-05-02 18:03:06
安徽一28岁美女相亲,不料,遇车祸右腿被截肢!相亲对象竟说:“嫁给我,医药费我出”

安徽一28岁美女相亲,不料,遇车祸右腿被截肢!相亲对象竟说:“嫁给我,医药费我出”

励职派
2026-04-17 12:44:31
永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

永久底层:硅谷的AI从业者普遍认为,普通人已经“完蛋了”。

不懂经1人独角兽
2026-05-02 23:35:50
我勒个去!一个全明星中锋,拿着2000万年薪,季后赛看管饮水机

我勒个去!一个全明星中锋,拿着2000万年薪,季后赛看管饮水机

球毛鬼胎
2026-05-03 15:56:20
美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

猫女的小树屋
2026-05-02 10:14:06
你太矮了!阿尔瓦罗谈与梅西互喷:除了身高我真没别的好黑他了

你太矮了!阿尔瓦罗谈与梅西互喷:除了身高我真没别的好黑他了

星耀国际足坛
2026-05-03 21:59:07
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

阿讯说天下
2026-04-18 11:52:55
5月19日!新机官宣:8.1英寸+165Hz+4K,全球首发!

5月19日!新机官宣:8.1英寸+165Hz+4K,全球首发!

科技堡垒
2026-05-01 02:00:10
2026年这5个行业,竟已发不出工资!形势真的很严峻了

2026年这5个行业,竟已发不出工资!形势真的很严峻了

细说职场
2026-04-26 16:52:27
2026-05-04 02:27:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11742文章数 117060关注度
往期回顾 全部

科技要闻

库克罕见"拒答"!苹果正被AI供应链卡脖子

头条要闻

高端小区多位业主拒收房:小区车位数量“蒸发”约1/3

头条要闻

高端小区多位业主拒收房:小区车位数量“蒸发”约1/3

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

黄晓明五一带娃去游乐场 父子幸福同框

财经要闻

后巴菲特时代,首场股东会透露了啥

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

旅游
手机
房产
本地
公开课

旅游要闻

日照五莲:文旅盛宴激活假日经济

手机要闻

华为多款新机销售表现曝光,畅享90 Pro Max激活百万台

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

本地新闻

用青花瓷的方式,打开西溪湿地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版