网易首页 > 网易号 > 正文 申请入驻

谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间

0
分享至

小交 发自 凹非寺
量子位 | 公众号 QbitAI

数学击败o1-preview,成本仅为十分之一,并且几乎没有思考延迟!

OpenAI《Her》全量开放同一天,谷歌Gemini 1.5迎来重大升级。

除此之外,价格也是原来的一半,速度限制提升2-3倍;输出速度提升2倍、延迟降为原来三分之一。

开发者可以通过 Google AI Studio 和 Gemini API免费访问。聊天版本还得再等等。

不过也有网友发现了华点,虽然数学能力很强,但还是没有打败o1-mini以及o1完整版(94.8)。

谷歌Gemini 1.5大升级

此次更新的有两个型号:Gemini-1.5-Pro-002Gemini-1.5-Flash-002

总结来说,主要有这些更新:

  • 对于1.5pro(输入和输出都小于128K),降价幅度大于50%。
  • 速率限制提升2-3倍;
  • 输出速度提高2倍,延迟降低3倍;
  • 更新了默认过滤器设置。

首先,提升了整体性能,尤其在数学、长文本以及多模态方面。

在MMLU-Pro上性能提高约7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。

除此之外,在视觉理解和代码代码生成的评估中也有2%-7%的提升。

根据开发人员的反馈,这两个模型现在都采用了更简洁的风格,目的是使这些模型更易于使用并降低成本。

对于摘要、问题解答和提取等用例,更新后模型的默认输出长度比以前的模型短 5-20%。

价格方面,1.5pro输入token降价64%,输出token降价52%,对增量缓存token降价64%,10月1日开始生效。

速率限制也有所提升,1.5 Flash的付费速率限制从1000RPM提高到2000RPM;1.5 Pro速率限制从360RPM到1000RPM。

另外,输出速度提高2倍,延迟减少为原来的三分之一。

对于新模型,过滤器已切换成可选,默认情况下不会应用过滤器。

最后的最后,还有Gemini 1.5 Flash-8B实验版本更新,在文本和多模态能力方面都有显著的提升。

网友水灵灵地测试上了

有网友就这么水灵灵地测试上了。

他测试了Gemini 1.5 Flash的音频转录功能。后者能在50-60秒内转录13分钟音频。

多个音频文件测试结果中,转录准确率接近99%。如果音频清晰,准确率能达到100%。


有网友测试了它的视觉理解能力,结果顺利通过,之前难倒了一众视觉模型。

不过讨论最多的还是它数学能力的提升。

不过倒也有网友表示,数学基准也没啥用。它已经饱和,而且污染了大多数模型的训练数据。在现实世界的数学难题里,这些还是没办法跟o1系列相提并论。

虽然但是,谷歌升级模型还有一个用处。

那就是push一下OpenAI,赶紧发布新模型,以此来“夺回王冠”。

什么时候赶紧把o1完整版发了。(Doge)

参考链接:
[1]https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/
[2]https://www.reddit.com/r/singularity/comments/1fohi2z/gemini_15_002_beats_o1preview_on_math_and_it_does/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA史上最水全明星!徐杰被女高中生击败:一老将三分赛比肩乔丹

CBA史上最水全明星!徐杰被女高中生击败:一老将三分赛比肩乔丹

篮球快餐车
2026-03-08 04:13:12
三镇VS国安首发:3外援PK4外援!18岁邓捷夫首秀,张玉宁塞鸟先发

三镇VS国安首发:3外援PK4外援!18岁邓捷夫首秀,张玉宁塞鸟先发

我爱英超
2026-03-08 17:59:21
霍尔木兹海峡如果断供,中国的石油能撑多久?我查完数据算了一遍

霍尔木兹海峡如果断供,中国的石油能撑多久?我查完数据算了一遍

何毅商业财经
2026-03-08 09:07:44
伊朗公布1332人遇难,内塔尼亚胡或被审判,特朗普急了

伊朗公布1332人遇难,内塔尼亚胡或被审判,特朗普急了

悲伤逆流成河水
2026-03-08 18:21:06
高中生AI创业,现在只招龙虾员工:每月成本2800

高中生AI创业,现在只招龙虾员工:每月成本2800

量子位
2026-03-08 18:04:11
跌破800万背后:我们是怎么同时踩中日韩两大神坑的?

跌破800万背后:我们是怎么同时踩中日韩两大神坑的?

白梦日记
2026-03-07 19:29:39
太突然!中国音乐家被撞身亡,年仅35岁

太突然!中国音乐家被撞身亡,年仅35岁

吃青菜长高
2026-03-06 14:52:43
法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
我提干排长那年,连长把他小姨子介绍给我,见面后她却扇了我一耳光

我提干排长那年,连长把他小姨子介绍给我,见面后她却扇了我一耳光

奶茶麦子
2026-03-07 21:54:08
央媒对何超琼的称呼变了,才明白,她早已走上和霍启刚相似的大道

央媒对何超琼的称呼变了,才明白,她早已走上和霍启刚相似的大道

寻墨阁
2026-03-07 16:54:23
一号之差!江苏大哥错失千万大奖,只拿下5000元奖金,一夜未眠!

一号之差!江苏大哥错失千万大奖,只拿下5000元奖金,一夜未眠!

芭比衣橱
2026-03-08 16:42:11
雷霆横扫勇士成联盟50胜首队 亚历山大27分连125场20+追张伯伦

雷霆横扫勇士成联盟50胜首队 亚历山大27分连125场20+追张伯伦

醉卧浮生
2026-03-08 11:59:55
淡水悖论:一个令科学家百思不得其解的谜题

淡水悖论:一个令科学家百思不得其解的谜题

魅力科学君
2026-03-04 18:11:29
吃醋了!朱易IG取关男友苏翊鸣,小苏发布与日本师妹晒金牌亲密互动

吃醋了!朱易IG取关男友苏翊鸣,小苏发布与日本师妹晒金牌亲密互动

818体育
2026-03-08 13:55:30
万万没想到,2026两会最火的提案不是医疗、就业,而是靳东的回答

万万没想到,2026两会最火的提案不是医疗、就业,而是靳东的回答

临云史策
2026-03-07 13:36:40
看陈冠希和谢霆锋近照,对比真惨烈!才知没有好骨相,老了多尴尬

看陈冠希和谢霆锋近照,对比真惨烈!才知没有好骨相,老了多尴尬

嫹笔牂牂
2026-03-07 07:16:06
36万亿美债压顶,中国拒不接盘!特朗普决定“弄死”大债主!

36万亿美债压顶,中国拒不接盘!特朗普决定“弄死”大债主!

毒sir财经
2025-10-12 20:07:17
陈毅处理上海1.4万国民党干部,做法惊动毛主席并获肯定

陈毅处理上海1.4万国民党干部,做法惊动毛主席并获肯定

优趣纪史记
2026-03-08 17:56:02
全家“人间蒸发”后在大陆现身:台官员弃职离台,背后隐情不一般

全家“人间蒸发”后在大陆现身:台官员弃职离台,背后隐情不一般

眼界看视野
2026-03-08 10:31:09
中超抖了抖!邝兆镭保护性首秀+传球成功率100%,记者:降维打击

中超抖了抖!邝兆镭保护性首秀+传球成功率100%,记者:降维打击

足球大腕
2026-03-08 12:39:21
2026-03-08 19:56:49
量子位 incentive-icons
量子位
追踪人工智能动态
12228文章数 176404关注度
往期回顾 全部

科技要闻

OpenClaw最大的推手是闲鱼和小红书

头条要闻

美军精锐空降师4000余人进入待命 被指或要推地面战

头条要闻

美军精锐空降师4000余人进入待命 被指或要推地面战

体育要闻

大伤后被交易,他说:22岁的我已经死了

娱乐要闻

周迅新恋情曝光,李亚鹏等人已成过去

财经要闻

油价要失控?

汽车要闻

9分钟充饱 全新腾势Z9GT首搭闪充技术26.98万起

态度原创

艺术
教育
时尚
家居
本地

艺术要闻

女警考生体测昏倒送医竟在救护车上惨遭轮奸!3.5公里地狱之路…

教育要闻

雅思词汇解析(166)| 就餐

2026春夏一定要拥有的6只包,好看又百搭

家居要闻

暖棕撞色 轻法奶油风

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

无障碍浏览 进入关怀版