网易首页 > 网易号 > 正文 申请入驻

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

0
分享至

新智元报道

编辑:犀牛 桃子

【新智元导读】谷歌Gemini 2.5 Pro(I/O版)横空出世,强势登顶LMAreana,斩获文本、视觉、编码三连冠,甚至编程能力全面碾压Claude 3.7,地表最强编码模型诞生。

AI编程王座,一夜易主。

昨晚,谷歌放出全新升级的Gemini 2.5 Pro Preview(I/O版),一举拿下三连冠,登顶LMeana。

它成为首个横扫文本、视觉、WebDev Arena基准的SOTA模型,编码性能碾压Claude 3.7 Sonnet。

不论是在代码转换、代码编辑,甚至是开发复杂的智能体工作流中,Gemini 2.5 Pro都能得心应手。

随手画个草图,Gemini 2.5 Pro即可将其变成一个绘画小程序。

只需一个提示,它就能将自然图像,转化为代码来表示独特的图案。

一句话用你的狗做一个小游戏。

Hassabis自豪地表示,只是随随便便提升了147分ELO,没什么大不了的。

谷歌首席科学家、Gemini的负责人Jeff Dean也连发数条推文来介绍更新后的Gemini 2.5 Pro,足见对其性能的信心。

左右滑动查看

开发者现在可以通过Google AI Studio和Vertex AI在Gemini API中开始使用更新后的Gemini 2.5 Pro进行开发。新模型也已经在Gemini App正式上线,支持Canvas等功能。

任何人都能通过单个提示来编写代码和构建交互式Web应用。

史上最强编程模型屠榜

Gemini 2.5 Pro Preview(I/O版)抢先体验版,是对2.5 Pro的全新升级,特别在编程方面有了大幅提升,尤其擅长打造引人入胜的互动网页应用。

在视觉基准测试中,Gemini 2.5 Pro Preview凭借巨大优势,领先GPT-4o、o3等模型。

在WebDev上,它成为首个超越Claude的编程模型,甚至连最新发布的GPT-4.1都不及Gemini 2.5 Pro。

从基准测试上看,新版Gemini 2.5 Pro相较于原版得到了全方位的提升。

谷歌在官博上声称,本来计划在谷歌I/O上发布这个更新,但看到大家对这款模型的热情高涨,所以决定提前放出,让所有人能尽早开发使用。

此次更新,除了以UI为中心的开发外,还扩展到了代码转换、代码编辑和开发复杂的AI智能体工作流。

在博客中,谷歌随手放了个小实例:一句话将图片上树叶的行为用代码表达出来。

更新后的Gemini 2.5 Pro在视频理解方面也拥有顶尖的性能,在VideoMME基准测试中的得分为84.8%,可以根据单条YouTube视频生成一个交互式学习网站。

谷歌在博客中还同时给出了与更新前Gemini 2.5 Pro之间的对比视频。

对于此次更新,AI编程工具Cursor CEO Michael Truell评价道:「我们对最新的Gemini 2.5 Pro感到非常兴奋,它在原本就很强大的编码能力上进一步提升。我们在内部观察到,新模型在调用工具时的失败率显著降低,这一改进相信会让用户觉得2.5 Pro在Cursor中的表现比以前更加出色。」

「氛围编程」王者,全网玩疯

Gemini 2.5 Pro Preview一经发布,热度直接爆表。开发者们借助其强大编码能力,构建出有趣的demo了。

谷歌大佬晒demo

谷歌研究员JB Alayrac表示,Gemini 2.5 Pro最新升级的代码能力,简直绝了。

更惊艳的是,将其编程实力和顶尖多模态视频理解能力相结合,直接把YouTube视频转录成p5.js动画。

在谷歌DeepMind研究员Ali Eslami发布的另一个演示中,用Gemini 2.5 Pro「氛围编程」芝加哥艺术学院收藏品的3D导览。

另一位研究员Fei Xia更是直呼,Gemini 2.5 Pro就是「氛围编程」的劳「模」。

根据植物高度与日照朝向、最佳种植间距、共生植物搭配,它可以轻松编写出智能花园规划器,自动生成最优布局。

谷歌AI产品主管Dave Messer制作了一个游戏——听音画猜。

Tim Bettridg用Canvas一次性开发了图书推荐应用,只需随手拍一张书架照片。

Patrick Loeber分享了,它还能制作一个界面更为复杂美观的理财APP。

研究员Megan Ben Dor Ruthven用Gemini 2.5 Pro制作了游戏卡片化学元素周期互动表。

开发者Chetaslua让Gemini 2.5 Pro制作了一个地球是如何形成的3D演示网站。

在测试过程中,o3无法编译,Claude 3.7蓝屏崩溃,只有Gemini 2.5 Pro才是当之无愧的王者。

网友Arthur Lee只用调整一次,就生成了一个3D太阳系,非常漂亮,而且能够随意交互。

Gemini 2.5 Pro还可以进行实时模拟。

下面演示中,它能够动态模拟出实时光影变化、昼夜循环,以及生成角色、名字,进行实时心率检测等生理指标。

在Gemini Canvas中通过 Maps API创建一款探索世界的应用。

物理模拟测试中,Gemini 2.5 Pro模拟桶中来回晃动的水,一举击败了Claude 3.7 Sonnet、o3。

一系列演示,切切实实展示了Gemini 2.5 Pro强大编程能力。

AI大佬Andrew Curran表示,「Gemini取代Gemini是一个信号,头把交椅仍会易主,但巨龙已经苏醒」。

参考资料:

https://techcrunch.com/2025/05/06/google-debuts-an-updated-gemini-2-5-pro-ai-model-ahead-of-i-o/

https://x.com/OfficialLoganK/status/1919770687167684808

https://x.com/GeminiApp/status/1919770661439865029

https://blog.google/products/gemini/gemini-2-5-pro-updates/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
民政局离婚人数暴涨!核心原因只有一个:婚姻不再将就

民政局离婚人数暴涨!核心原因只有一个:婚姻不再将就

好贤观史记
2025-12-29 23:45:05
110年无人能破!18岁的亚马尔改写巴萨历史,连梅西都没做到

110年无人能破!18岁的亚马尔改写巴萨历史,连梅西都没做到

刘哥谈体育
2026-02-09 10:00:22
1903年,30岁梁启超和17岁王桂荃行房,两人大汗淋漓

1903年,30岁梁启超和17岁王桂荃行房,两人大汗淋漓

南权先生
2026-02-03 15:53:04
随着王楚钦4-2逆转张本智和,赛后邓亚萍指导5句点评,句句在理!

随着王楚钦4-2逆转张本智和,赛后邓亚萍指导5句点评,句句在理!

田先生篮球
2026-02-09 12:13:28
微博之夜的King和Queen终于揭晓啦,

微博之夜的King和Queen终于揭晓啦,

小光侃娱乐
2026-02-10 09:30:12
究竟什么是“赤马红羊劫”?赤马红羊对谁不利?且看如何应对!

究竟什么是“赤马红羊劫”?赤马红羊对谁不利?且看如何应对!

神奇故事
2026-02-07 23:12:06
冬奥会速度滑冰女子1000米决赛,中国三将齐亮相

冬奥会速度滑冰女子1000米决赛,中国三将齐亮相

闪电新闻
2026-02-10 09:07:59
“情况罕见”!台湾桃园机场10分钟内3个航班发出“Mayday”求救信号

“情况罕见”!台湾桃园机场10分钟内3个航班发出“Mayday”求救信号

环球网资讯
2026-02-09 09:06:06
脑梗的源头被查出,肥肉没上榜,第1名很多人可能每天都在吃!

脑梗的源头被查出,肥肉没上榜,第1名很多人可能每天都在吃!

全球军事记
2025-11-29 13:46:37
原来一万块钱的威力这么大!网友:钱不是万能的,但没钱寸步难行

原来一万块钱的威力这么大!网友:钱不是万能的,但没钱寸步难行

另子维爱读史
2025-12-30 19:27:54
不装了!和朱小伟离婚4年,耗尽人气回心转意的陈亚男,原形毕露

不装了!和朱小伟离婚4年,耗尽人气回心转意的陈亚男,原形毕露

老屬科普
2026-02-09 22:16:13
日媒:石破茂告诫高市早苗,众议院选举胜利不代表“你可以想做什么就做什么”

日媒:石破茂告诫高市早苗,众议院选举胜利不代表“你可以想做什么就做什么”

环球网资讯
2026-02-09 15:00:37
42岁刘翔现状:环游世界不上班,终身合同管温饱,拉黑喷子享清净

42岁刘翔现状:环游世界不上班,终身合同管温饱,拉黑喷子享清净

小徐讲八卦
2026-02-09 18:42:29
企业退休人员退休金偏低,贡献不输事业单位,建议涨薪保障生活

企业退休人员退休金偏低,贡献不输事业单位,建议涨薪保障生活

小陆搞笑日常
2026-02-10 08:48:22
美国防部称在印度洋拦截一艘油轮

美国防部称在印度洋拦截一艘油轮

新华社
2026-02-09 21:14:26
町田主帅:对申花将尽力踢出我们自己的比赛风格,争取带3分回国

町田主帅:对申花将尽力踢出我们自己的比赛风格,争取带3分回国

懂球帝
2026-02-10 00:41:18
《红楼梦》8个成语,早知道,少走很多弯路

《红楼梦》8个成语,早知道,少走很多弯路

诗词世界
2026-01-25 06:06:26
一夜之间,房价开了一个天大的玩笑

一夜之间,房价开了一个天大的玩笑

大川东山再起
2025-12-28 14:59:35
中国香港“保姆车”冠军变了:日系MPV让位,国产车冲到了第一

中国香港“保姆车”冠军变了:日系MPV让位,国产车冲到了第一

柳先说
2026-02-03 17:12:14
米兰冬奥|2月10日看点:短道速滑将诞生首金,中国队力争混接卫冕

米兰冬奥|2月10日看点:短道速滑将诞生首金,中国队力争混接卫冕

文汇报
2026-02-10 04:38:08
2026-02-10 10:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14508文章数 66620关注度
往期回顾 全部

科技要闻

Claude搅动硅谷,AI开始抢企业软件饭碗了?

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

退保黑灰产仍在“隐秘角落”顶风接单

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

手机
本地
游戏
公开课
军事航空

手机要闻

REDMI、一加、iQOO新机销量比比看,结果很意外

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

愤怒了!《如龙 极3》删除跨性别支线引玩家不满

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以军持续在约旦河西岸多地发动突袭

无障碍浏览 进入关怀版