网易首页 > 网易号 > 正文 申请入驻

免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士

0
分享至

作者|冬梅

在 OpenAI “12 天马拉松”发布的第 11 天,他们平平无奇的发布又被谷歌抢了风头。

刚刚,谷歌发布了实验性的“Gemini 2.0 Flash Thinking”模型,它以令人印象深刻的推理能力而闻名,可以“明确地展示自己的思维”来解决复杂问题,其水平与物理、化学和生物学博士生相当。

谷歌 CEO Sundar Pichai 在社交网络 X 上的一篇文章中写道,这是“我们迄今为止最周到的模型,”还配上了笑脸。

顾名思义,它建立在“2.0 Flash 的速度和性能”之上。谷歌表示,它“经过训练可以大声思考”,从而“具有更强的推理性能”。

为了与 OpenAI 的 o1 竞争,谷歌 DeepMind 首席科学家 Jeff Dean 在 X 上的一条发文中表示,该模型“经过训练,可以使用思维来加强其推理能力”,同时还受益于速度更快的 Gemini Flash 2.0 模型。

Dean 分享的演示展示了 Gemini 2.0 Flash Thinking 如何通过“思考”一系列步骤,然后再提供解决方案,从而解答物理问题。谷歌分享了几个跨物理和概率的演示:

Gemini 2.0 Flash Thinking 现已在 Google AI Studio 和 Vertex AI 中推出。它在 Chatbot Arena LLM 排行榜上首次亮相,位居“所有类别第一” 。就在昨天,谷歌在 Gemini 应用程序中推出了 2.0 Experimental Advanced,Gemini-Exp-1206 也位居排行榜榜首。

这不一定是人类那样的“推理”,但这意味着机器将指令分解为可以产生更强结果的更小的任务。

另一个示例由 Google 产品负责人 Logan Kilpatrick 发布,展示了该模型如何推理解决涉及视觉和文本元素的问题。“这只是我们推理之旅的第一步,”Kilpatrick 说。

更易于理解和更透明的推理

在开发者文档中,谷歌解释说,“思考模式的响应推理能力比基础版 Gemini 2.0 Flash 模型更强”,而基础版 Gemini 2.0 Flash 模型是谷歌最新、最出色的模型,仅在 8 天前发布。

新模型仅支持 32000 个标记输入(约 50-60 页文本),并且每个输出响应可以产生 8000 个标记。在 Google AI Studio 的侧面板中,该公司声称它最适合“多模式理解、推理”和“编码”。

该模型的训练过程、架构、许可和成本的完整细节尚未公布。目前,它在 Google AI Studio 中显示每个令牌的成本为零。

与 OpenAI 的竞争推理模型 o1 和 o1 mini 不同,Gemini 2.0 允许用户通过下拉菜单访问其逐步推理,从而更清晰、更透明地了解模型如何得出结论。

通过允许用户了解决策过程,Gemini 2.0 解决了人们对人工智能作为“黑匣子”运行的长期担忧,并使该模型(许可条款仍不明确)与竞争对手的其他开源模型相提并论。

一些开发者对该模型的早期简单测试表明,它可以正确而快速地(1 到 3 秒内)回答一些对于其他 AI 模型来说非常棘手的问题,例如计算“Strawberry”一词中的 R 的数量。(见上面的截图)。

原生支持图像上传和分析

Gemini 2.0 Flash Thinking 是对竞争对手 OpenAI o1 系列的进一步改进,旨在处理跳跃中的图像。

o1 最初是纯文本模型,但后来扩展到包括图像和文件上传分析。目前,这两种模型也只能返回文本。

根据开发者文档显示,Gemini 2.0 Flash Thinking 目前还不支持与谷歌搜索落地,也不支持与其他谷歌应用和外部第三方工具集成。

Gemini 2.0 Flash Thinking 的多模式能力扩展了其潜在用例,使其能够应对结合不同类型数据的场景。

例如,在一项测试中,该模型解决了一个需要分析文本和视觉元素的难题,展示了其跨格式集成和推理的多功能性。

开发人员可以通过 Google AI Studio 和 Vertex AI 利用这些功能,其中模型可供实验。

随着人工智能领域的竞争日趋激烈,Gemini 2.0 Flash Thinking 可能标志着问题解决模型新时代的开始。它能够处理多种数据类型、提供可视化推理并大规模执行,这使它成为推理人工智能市场的有力竞争者,可与 OpenAI 的 o1 系列及其他产品相媲美。

https://lmarena.ai/?leaderboard

https://analyticsindiamag.com/ai-news-updates/openai-sets-the-stage-for-agentic-ai-with-chatgpt-desktop-apps-for-mac-and-windows/

InfoQ 老友!请留步!极客邦 1 号客服上线工作啦!

后续我将通过微信视频号,以视频的形式持续更新技术话题、未来发展趋势、创业经验、商业踩坑教训等精彩内容,和大家一同成长,开启知识交流之旅

今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1954 年万余志愿军战俘从台湾归来,蒋经国亲迎现场落泪失语

1954 年万余志愿军战俘从台湾归来,蒋经国亲迎现场落泪失语

唠叨说历史
2026-04-09 17:41:05
拒演率93%!最寒酸综艺收官,赵晓卉两天救场炸翻全场:你们装什么装?

拒演率93%!最寒酸综艺收官,赵晓卉两天救场炸翻全场:你们装什么装?

可乐谈情感
2026-04-12 16:58:49
广东一男子3年内累计出险记录高达30次!自称开车时不会让行…

广东一男子3年内累计出险记录高达30次!自称开车时不会让行…

广东活动
2026-04-12 12:14:13
真无奈!家长哭诉,孩子英语本科送外卖,工资比很多文职岗位都高

真无奈!家长哭诉,孩子英语本科送外卖,工资比很多文职岗位都高

火山詩话
2026-04-12 10:32:30
古力娜扎:真空上阵是放飞自我还是资本博弈?

古力娜扎:真空上阵是放飞自我还是资本博弈?

娱乐领航家
2026-04-02 21:00:03
快讯!中国海军远洋战力迎来历史性突破!

快讯!中国海军远洋战力迎来历史性突破!

达文西看世界
2026-04-12 10:59:04
埃梅里:大马丁赛前小腿感觉不适;我们正在重新找回信心

埃梅里:大马丁赛前小腿感觉不适;我们正在重新找回信心

懂球帝
2026-04-13 00:23:38
四处播种的后果!24岁状元,4个孩子4位母亲,现在又被告上法庭

四处播种的后果!24岁状元,4个孩子4位母亲,现在又被告上法庭

你的篮球频道
2026-04-12 08:38:25
缺少5100万强援,火箭队仍超50胜!休赛期2首发归队,夺冠有戏?

缺少5100万强援,火箭队仍超50胜!休赛期2首发归队,夺冠有戏?

梅亭谈
2026-04-12 23:23:41
如果没罚分,中超5强表现怎样?国安距副班长仅2分,申花仍排第2

如果没罚分,中超5强表现怎样?国安距副班长仅2分,申花仍排第2

体坛鉴春秋
2026-04-12 22:52:41
2026年车企“最惨”开局:一季度的目标完成度,几乎都低于20%

2026年车企“最惨”开局:一季度的目标完成度,几乎都低于20%

互联网.乱侃秀
2026-04-12 11:33:02
鲁比奥再撤销伊朗精英绿卡,将其驱逐出境,撤销人数或高达4000人

鲁比奥再撤销伊朗精英绿卡,将其驱逐出境,撤销人数或高达4000人

山河路口
2026-04-12 00:55:26
成都蓉城逆转国安!媒体人热议:真的要夺冠,蜕变成真正强队

成都蓉城逆转国安!媒体人热议:真的要夺冠,蜕变成真正强队

奥拜尔
2026-04-12 21:52:55
2-1绝杀 让亚洲杯变东亚杯!四强对阵出炉 中国女足跟日本争决赛

2-1绝杀 让亚洲杯变东亚杯!四强对阵出炉 中国女足跟日本争决赛

侃球熊弟
2026-04-13 00:02:58
马伊琍官宣喜讯不到24小时 文章高调求“复合” 姚笛才是笑到最后

马伊琍官宣喜讯不到24小时 文章高调求“复合” 姚笛才是笑到最后

潮鹿逐梦
2026-04-11 14:48:49
深圳大学拟租800万元豪宅当学生宿舍?业主担忧:公共资源会被严重挤占,不愿小区被贴上“宿舍”标签;网友羡慕:每月几百元就能住豪宅

深圳大学拟租800万元豪宅当学生宿舍?业主担忧:公共资源会被严重挤占,不愿小区被贴上“宿舍”标签;网友羡慕:每月几百元就能住豪宅

大风新闻
2026-04-12 15:46:21
广东战胜广厦! 听听各界专家媒体怎么说 宏远已经坐稳前四!

广东战胜广厦! 听听各界专家媒体怎么说 宏远已经坐稳前四!

体坛热消息
2026-04-12 21:46:53
47岁智性恋天花板,让10w网友对“大女主”祛魅了

47岁智性恋天花板,让10w网友对“大女主”祛魅了

英国那些事儿
2026-04-11 23:19:13
为啥淘宝,拼多多几块钱的东西还能包邮?看完你就明白了!

为啥淘宝,拼多多几块钱的东西还能包邮?看完你就明白了!

呼呼历史论
2026-04-10 21:17:24
向太劝醒年轻人:没200万存款别买车!自己只开二手车钱全投房产

向太劝醒年轻人:没200万存款别买车!自己只开二手车钱全投房产

观鱼听雨
2026-04-11 20:38:34
2026-04-13 01:11:00
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1418文章数 145关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

特朗普:将封锁任何试图进出霍尔木兹海峡的船只

头条要闻

特朗普:将封锁任何试图进出霍尔木兹海峡的船只

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

时尚
艺术
房产
家居
公开课

被周冬雨、林更新戴上热搜的珠宝,究竟有多惊艳?

艺术要闻

揭开她笔下女人的神秘面纱,豪放洒脱的魅力令人惊叹!

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版