网易首页 > 网易号 > 正文 申请入驻

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

0
分享至

新智元报道

编辑:Aeneas KingHZ

【新智元导读】如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。

虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强!

在试用过程中,网友们逐渐发现,这个模型真的强到发指。

在门萨Norway的IQ测试中,它已经突破了130。

随后,更硬核的证据来了——在MathArena测试中,它直接获得了第一名!

注意,这里用的基本都是LLM从未见过的题。

在哈佛-麻省理工大学数学竞赛(HMMT)中,领先第二名15%

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强,这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上,Gemini的领先趋势已经非常明显。

Gemini 2.5 Pro (exp),免费用户也能用

好消息是,现在所有用户都能用上Gemini 2.5 Pro了。

就在今天,谷歌官宣:向所有Gemini用户,推出Gemini 2.5 Pro实验版!

而且,还是全免费。

唯一美中不足的是,Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户,就可以享有更高级的访问权限,和更大的上下文窗口。

在上周三刚刚发布时,Gemini 2.5 Pro,还仅仅面向Gemini Advanced订阅者开放,订阅价格为每月19.99美元。

而随后,模型还会被推广到安卓和iOS应用上。

目前尚不清楚,谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户,还是说今天的举措仅针对测试阶段。

在此之前,似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认:大模型赛,谷歌已经领先了

AI社区Reddit上的网友们公认:在客观上,谷歌的模型已经领先了。

或许是有史以来第一次,OpenAI明确处于落后地位,Anthropic也是如此。

虽然凭吉卜力表情包抢了风头,但这种廉价的伎俩只会在短期内有用。在大模型赛中,局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试,几乎一切投票都表明,Gemini是无可争议的领军者。

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估,Gemini 2.5在大部分测试中都遥遥领先,成绩排名第一。

同时,输出速度仅次于 Gemini 2.0 Flash,位列第二。

当然,如果从原理上看,LLM的确没有在做数学,因为它们的本质仍然是概率性的,是做从训练数据中预测最可能的答案。

最强编程模型:模拟宇宙都可以

谷歌的技术主管Addy Osmani,表示Gemini 2.5 Pro是谷歌最好的编程模型,而且免费!

他给出了一段Gemini制作的3D飞行小游戏。

只需提示一次,Gemini 2.5 Pro可以在Three.js中的物理模拟!

多次提示,还可以改进编程效果。

开源链接:https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己「宇宙模拟器」,只需几次提示。

建立AI智能体DAIR.AI的elvis,则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型:

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf,他生成了AI搜索代理应用。

不少网友体验Gemini 2.5 Pro编程之后,表示Claude的确危险了!

左右滑动查看

初步的编码测试中的结果显示,Gemini 2.5 Pro把行业水平提升了一个档次。

对此,「AI智能体先驱」的创始人Silas Alberti,表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程,让智能体自动化一切。

甚至,有人用Gemini 2.5 Pro测试了一个项目,使用A*算法为高速列车寻找最优解,这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是,虽然它经常搞乱语法,比如试图把所有代码压缩到一行,但它完成了不少高质量的工作。

参考资料:

https://artificialanalysis.ai/models/gemini-2-5-pro

https://x.com/petergyang/status/1906007718961492391

https://x.com/QiaochuYuan/status/1905967688310268168

https://x.com/omarsar0/status/1906404825509560408

https://x.com/renderfiction/status/1905998185962643767

https://x.com/GeminiApp/status/1906131622736679332

https://x.com/silasalberti/status/1905826070370144450

https://www.reddit.com/r/singularity/comments/1jnbtu2/testing_gemini_25_pro_with_a_project_a_algorithm/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

南权先生
2026-01-26 15:41:26
铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

阿七说史
2026-03-13 15:56:51
复盘重庆3-3成都:比赛精彩跌宕起伏,“川渝德比”打出顶级水准

复盘重庆3-3成都:比赛精彩跌宕起伏,“川渝德比”打出顶级水准

里芃芃体育
2026-03-22 00:10:04
中国电磁炮专家,竟是美国间谍,出卖大量情报,让国家损失惨重

中国电磁炮专家,竟是美国间谍,出卖大量情报,让国家损失惨重

青烟小先生
2026-03-02 17:17:14
iPhone18 Pro秋季来袭!改掉槽点,灵动岛缩水,这波配色你爱吗?

iPhone18 Pro秋季来袭!改掉槽点,灵动岛缩水,这波配色你爱吗?

数码Antenna
2026-03-19 11:08:04
津门虎天崩开局!3轮不胜-9分垫底,媒体人热议:彻头彻尾失败

津门虎天崩开局!3轮不胜-9分垫底,媒体人热议:彻头彻尾失败

奥拜尔
2026-03-21 17:56:37
中国留学生恶意透支日本多张信用卡之后跑路回国?

中国留学生恶意透支日本多张信用卡之后跑路回国?

日本物语
2026-03-14 20:32:49
足坛著名酒鬼,喝酒喝到尿床,戒酒后却成为维埃里口中的雄狮

足坛著名酒鬼,喝酒喝到尿床,戒酒后却成为维埃里口中的雄狮

足篮大世界
2026-03-21 16:45:26
推荐《二叔有情》裴二郎玉娘,小说已完结

推荐《二叔有情》裴二郎玉娘,小说已完结

芒果捞头条君
2022-09-29 11:02:25
恒指期货夜盘收跌2.09%,报24722.44点

恒指期货夜盘收跌2.09%,报24722.44点

每日经济新闻
2026-03-21 06:15:04
斯诺克大冷门!名将终结不败纪录,吴宜泽冲冠,火箭35万奖金到手

斯诺克大冷门!名将终结不败纪录,吴宜泽冲冠,火箭35万奖金到手

刘姚尧的文字城堡
2026-03-21 08:30:41
苹果CEO库克:新款Mac吸引了创纪录的首购客户

苹果CEO库克:新款Mac吸引了创纪录的首购客户

第一财经资讯
2026-03-21 09:00:44
人贩子“梅姨”落网多位受害者和寻子家长发声,一文回顾“梅姨案”始末

人贩子“梅姨”落网多位受害者和寻子家长发声,一文回顾“梅姨案”始末

扬子晚报
2026-03-21 17:28:16
体检报告里这一项异常,竟是脑梗信号?9成人不重视,后悔太晚!

体检报告里这一项异常,竟是脑梗信号?9成人不重视,后悔太晚!

医学科普汇
2026-03-05 20:20:03
广州建筑一地标项目“难产”,曾规划投资近100亿元

广州建筑一地标项目“难产”,曾规划投资近100亿元

中国能源网
2026-03-21 08:45:13
iOS 微信上了个新版本,大量新功能正在陆续推出!

iOS 微信上了个新版本,大量新功能正在陆续推出!

花果科技
2026-03-22 00:03:12
清华大学今年起陆续出版61册思政课教学用书

清华大学今年起陆续出版61册思政课教学用书

中国青年报
2026-03-19 21:27:08
34岁周冬雨和28岁刘昊然被曝隐婚?去年生孩子,女方父母满意女婿

34岁周冬雨和28岁刘昊然被曝隐婚?去年生孩子,女方父母满意女婿

阿郎娱乐
2026-03-19 07:29:22
2013年,康熙传位遗诏问世,揭秘了真实的雍正夺位之谜

2013年,康熙传位遗诏问世,揭秘了真实的雍正夺位之谜

谈古论今历史有道
2026-03-21 12:45:03
3-0到0-4,双冠王经历从天堂到地狱,球迷:换帅,3中卫能玩明白

3-0到0-4,双冠王经历从天堂到地狱,球迷:换帅,3中卫能玩明白

我就是一个说球的
2026-03-22 00:08:14
2026-03-22 01:40:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14777文章数 66705关注度
往期回顾 全部

数码要闻

华为Atlas 350加速卡上市,搭载全新昇腾950PR处理器

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

科技要闻

宇树招股书拆解,人形机器人出货量第一!

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

家居
手机
旅游
亲子
公开课

家居要闻

时空交织 空间绮梦

手机要闻

终端市场集体喊“涨” 手机面板持续走“跌”

旅游要闻

【花Young贵阳】春日限定!十里河滩海棠花盛开引客来

亲子要闻

教育部发布通知,幼儿园将迎来大变动,家长:幸福来得太突然!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版