网易首页 > 网易号 > 正文 申请入驻

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

0
分享至

新智元报道

编辑:Aeneas KingHZ

【新智元导读】如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。

虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强!

在试用过程中,网友们逐渐发现,这个模型真的强到发指。

在门萨Norway的IQ测试中,它已经突破了130。

随后,更硬核的证据来了——在MathArena测试中,它直接获得了第一名!

注意,这里用的基本都是LLM从未见过的题。

在哈佛-麻省理工大学数学竞赛(HMMT)中,领先第二名15%

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强,这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上,Gemini的领先趋势已经非常明显。

Gemini 2.5 Pro (exp),免费用户也能用

好消息是,现在所有用户都能用上Gemini 2.5 Pro了。

就在今天,谷歌官宣:向所有Gemini用户,推出Gemini 2.5 Pro实验版!

而且,还是全免费。

唯一美中不足的是,Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户,就可以享有更高级的访问权限,和更大的上下文窗口。

在上周三刚刚发布时,Gemini 2.5 Pro,还仅仅面向Gemini Advanced订阅者开放,订阅价格为每月19.99美元。

而随后,模型还会被推广到安卓和iOS应用上。

目前尚不清楚,谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户,还是说今天的举措仅针对测试阶段。

在此之前,似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认:大模型赛,谷歌已经领先了

AI社区Reddit上的网友们公认:在客观上,谷歌的模型已经领先了。

或许是有史以来第一次,OpenAI明确处于落后地位,Anthropic也是如此。

虽然凭吉卜力表情包抢了风头,但这种廉价的伎俩只会在短期内有用。在大模型赛中,局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试,几乎一切投票都表明,Gemini是无可争议的领军者。

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估,Gemini 2.5在大部分测试中都遥遥领先,成绩排名第一。

同时,输出速度仅次于 Gemini 2.0 Flash,位列第二。

当然,如果从原理上看,LLM的确没有在做数学,因为它们的本质仍然是概率性的,是做从训练数据中预测最可能的答案。

最强编程模型:模拟宇宙都可以

谷歌的技术主管Addy Osmani,表示Gemini 2.5 Pro是谷歌最好的编程模型,而且免费!

他给出了一段Gemini制作的3D飞行小游戏。

只需提示一次,Gemini 2.5 Pro可以在Three.js中的物理模拟!

多次提示,还可以改进编程效果。

开源链接:https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己「宇宙模拟器」,只需几次提示。

建立AI智能体DAIR.AI的elvis,则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型:

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf,他生成了AI搜索代理应用。

不少网友体验Gemini 2.5 Pro编程之后,表示Claude的确危险了!

左右滑动查看

初步的编码测试中的结果显示,Gemini 2.5 Pro把行业水平提升了一个档次。

对此,「AI智能体先驱」的创始人Silas Alberti,表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程,让智能体自动化一切。

甚至,有人用Gemini 2.5 Pro测试了一个项目,使用A*算法为高速列车寻找最优解,这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是,虽然它经常搞乱语法,比如试图把所有代码压缩到一行,但它完成了不少高质量的工作。

参考资料:

https://artificialanalysis.ai/models/gemini-2-5-pro

https://x.com/petergyang/status/1906007718961492391

https://x.com/QiaochuYuan/status/1905967688310268168

https://x.com/omarsar0/status/1906404825509560408

https://x.com/renderfiction/status/1905998185962643767

https://x.com/GeminiApp/status/1906131622736679332

https://x.com/silasalberti/status/1905826070370144450

https://www.reddit.com/r/singularity/comments/1jnbtu2/testing_gemini_25_pro_with_a_project_a_algorithm/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本国内紧急备战,媒体曲解国防部发言,网民叫嚣“出兵中国”

日本国内紧急备战,媒体曲解国防部发言,网民叫嚣“出兵中国”

十三级台阶
2025-11-15 18:14:37
日本敢不敢先打

日本敢不敢先打

求实处
2025-11-16 00:27:27
央视曝光4种“致癌日用品”,家里千万别囤!越囤全家身体越差!

央视曝光4种“致癌日用品”,家里千万别囤!越囤全家身体越差!

39健康网
2025-11-16 20:35:40
经济形势有可能超乎我们的想象

经济形势有可能超乎我们的想象

经济学教授V
2025-11-16 18:05:56
中国大陆至日本航班量大幅下滑

中国大陆至日本航班量大幅下滑

极目新闻
2025-11-16 20:42:16
参加志愿活动期间,李春来同志突发疾病逝世

参加志愿活动期间,李春来同志突发疾病逝世

新京报政事儿
2025-11-16 16:37:31
山西摔狗反杀案,律师一句话问懵法官:天黑后你敢去案发现场吗?

山西摔狗反杀案,律师一句话问懵法官:天黑后你敢去案发现场吗?

慢半拍sir
2025-11-15 15:15:14
八路军和新四军那么厉害,为何不去打淞沪会战?

八路军和新四军那么厉害,为何不去打淞沪会战?

《中国国家历史》
2025-11-14 22:31:25
刘恺威要是看到这照片,估计得懵。

刘恺威要是看到这照片,估计得懵。

陈意小可爱
2025-11-17 01:44:46
大结局要来了?泽连斯基,下命令了!

大结局要来了?泽连斯基,下命令了!

大嘴说天下
2025-11-15 21:36:57
俄25%的电力被打瘫痪,不良自媒体开始炮制红军村“大鱼场”

俄25%的电力被打瘫痪,不良自媒体开始炮制红军村“大鱼场”

史政先锋
2025-11-16 19:31:46
全运会最新金牌榜!山东广东均36金齐头并进,江苏反超浙江

全运会最新金牌榜!山东广东均36金齐头并进,江苏反超浙江

老吴说体育
2025-11-17 00:43:35
社评:中国公民需谨慎前往日本的四个原因

社评:中国公民需谨慎前往日本的四个原因

环球网资讯
2025-11-17 00:03:43
消费降级了,来这里买东西的人越来越多了

消费降级了,来这里买东西的人越来越多了

微微热评
2025-11-16 16:05:57
降息,突变!美联储,大消息!

降息,突变!美联储,大消息!

证券时报
2025-11-16 15:37:10
赴日旅行警告发布之后,不少游客因无法退票选择继续旅行

赴日旅行警告发布之后,不少游客因无法退票选择继续旅行

映射生活的身影
2025-11-16 01:55:20
64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片

64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片

乡野小珥
2025-10-27 11:08:35
流感H3N2毒株严重可致呼吸衰竭,专家提醒:须在48小时内吃奥司他韦

流感H3N2毒株严重可致呼吸衰竭,专家提醒:须在48小时内吃奥司他韦

东方豪侠
2025-11-16 11:45:45
高市早苗:独岛是日本固有领土,早晚都得收回!高市又抛惊天言论

高市早苗:独岛是日本固有领土,早晚都得收回!高市又抛惊天言论

娱乐圈的笔娱君
2025-11-16 07:12:49
巴厘岛车祸致中国游客5死8伤,亲历者:遇难者都是家中长辈 事发时司机示意刹车失灵,租车公司老板已失联

巴厘岛车祸致中国游客5死8伤,亲历者:遇难者都是家中长辈 事发时司机示意刹车失灵,租车公司老板已失联

红星新闻
2025-11-16 16:58:22
2025-11-17 02:23:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13882文章数 66249关注度
往期回顾 全部

数码要闻

比Intel 4004更早!全球首款微处理器MP944:曾严格保密近30年

头条要闻

中国公民需谨慎前往日本 四大原因披露

头条要闻

中国公民需谨慎前往日本 四大原因披露

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

科技要闻

雷军,怒了!刚刚连发多条微博

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

教育
时尚
手机
本地
军事航空

教育要闻

妈妈晒高二儿子吃宵夜,女网友眼睛看直了:这颜值,小姑娘遭殃了

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

手机要闻

古尔曼:苹果iPhone正经历史上最大变革,iPhone 18/Pro分开发布

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

军事要闻

海军四川舰顺利完成首次航行试验

无障碍浏览 进入关怀版