网易首页 > 网易号 > 正文 申请入驻

从Gemini到豆包:全球两大AI巨头为何走上同一条路?

0
分享至

来源:市场资讯

(来源:第一财经资讯)

视频模型Seedance 2.0、图像模型Seedream 5.0 Lite连续刷屏后,2月14日,字节跳动正式宣布推出豆包大模型2.0(Doubao-Seed-2.0,简称豆包2.0)系列。

自2023年,豆包大模型初始测试版上线,2024年正式对外发布,豆包代际模型版本更新已经过去近一年半时间。其间持续在文本基础、多模态强化、深度思考、Agent(智能体)执行等方面更新,直至此次版本,在2.0全能力升级。

此次备受关注的2.0版本,具备全栈模型矩阵 + 多模态理解 + 企业级 Agent + 极致成本四大差异化优势,已跻身全球第一梯队,成为 Agent 时代的关键玩家。在多项公开测试集上表现突出,接近Google Gemini3,和具备更高性价比。

字节跳动官方明确表示,旗舰版豆包2.0 Pro“面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro”。从技术参数到产品定位,豆包2.0与Google Gemini的相似性正在从“对标”走向“一致”。而这种“一致”并非偶然的“撞车”,本质是全球顶尖AI实验室在通往通用人工智能(AGI)路径上达成的战略共识——AI最终需要为人类完成任务执行,而这需要对真实世界物理运行规律的理解。

版本代际更新

此次更新,豆包2.0 系列模型提供 Pro、Lite、Mini 三款不同尺寸的通用 Agent 模型。该系列通用模型的多模态理解能力实现全面升级,并强化了LLM 与Agent 能力,使模型在真实长链路任务中能够稳定推进。同时进一步把能力边界从竞赛级推理扩展到研究级任务,在高经济价值与科研价值任务评测中达到业界第一梯队水平。

据官方介绍,此次豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

其中,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,数学和推理能力达到世界顶尖水平。

另外,大模型执行长链路复杂任务,需要丰富的世界知识。豆包2.0加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列。

在教育、娱乐、办公等众多场景中,大模型需要理解图表、复杂文档、视频等内容。对此,豆包2.0全面升级多模态理解能力,视觉推理、空间感知、长上下文理解等权威测试均取得业界最佳表现。

面对动态场景,豆包2.0强化了对时间序列与运动感知的理解能力。以健身场景为例,接入豆包2.0的智能健身App可实时分析用户动作视频,一旦检测到深蹲姿势偏移,立即语音纠正——这正是环境感知与主动交互能力的落地。目前,这一能力已延伸至穿搭建议、老人看护等领域。

Agent能力是大模型具备行动力的关键。测试成绩显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶尖水平,在HLE-Text(人类的最后考试)上更是获得54.2的最高分,大幅领先于其他模型。

目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择专家模式即可对话体验。火山引擎也已上线豆包2.0系列模型API服务。

价格方面,豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势。豆包2.0 Lite更是极具性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。

强化执行任务能力

此次豆包2.0的全面升级,核心落点在“真实世界复杂任务的执行力”。而这一能力的根基,正是多模态理解层的突破——只有让模型真正看懂物理世界的动态与逻辑,它才能从“答题者”进化为“执行者”。

字节模型团队观察到一个典型失衡:语言模型已经可以顺利解决竞赛难题,但放在真实世界中,它们依然很难端到端地完成实际任务——比如一次性构建一个设计精良、功能完整的小程序。

LLM 和 Agent 为什么在处理现实问题时屡屡碰壁?团队认为,原因主要来自两点:真实世界任务往往跨越更长时间尺度、包含多个阶段,而现有LLM Agent 难以自主构建高效工作流,并在长时间跨度中积累经验;真实世界知识具有很强的领域壁垒且呈长尾分布,各行业的经验不在训练语料的高频区,导致即便模型擅长数学与代码,其在专业场景中往往价值有限。

在提升了长程任务执行能力的同时,Seed2.0 还进一步降低了推理成本。其模型效果与业界顶尖大模型相当,同时 token 定价降低了约一个数量级。在现实世界的复杂任务中,由于大规模推理与长链路生成将消耗大量token,这一成本优势将变得更为关键。

另外在多模态理解能力方面,豆包2.0 Pro在视觉推理、空间感知、运动理解、长视频理解等维度,在大多数相关基准测试中取得最高分。此前刷屏AI视频模型Seedance2.0正是多模态能力支撑的体现之一。

Seedance 2.0核心升级主要体现在原声音画同步、多镜头长叙事、多模态可控生成。用户输入提示词与参考图,可一键生成带完整原生音轨的多镜头视频,模型自动解析叙事逻辑,确保角色、光影、风格与氛围高度统一。此前马斯克点评称:模型发展非常迅速。

据官方介绍,豆包2.0可以处理复杂视觉输入,并完成实时交互和应用生成。无论是从图像中提取结构化信息,还是通过视觉输入生成交互式内容,Seed2.0都能高效、稳定地完成任务。

这正是Gemini一直强调的“原生多模态”能力——不是简单拼接视觉与语言,而是在底层实现跨模态的深度对齐。豆包2.0的升级方向与Google的Gemini 3 Pro在视频理解、空间推理上的优势高度一致。

而豆包2.0与Gemini在基础模型层面均选择死磕多模态,本质上是在进行一场 “世界模型”的军备竞赛。它们不再满足于让AI做一个“语言游戏高手”,而是希望AI成为一个能看懂、听懂、理解物理世界复杂性的“数字人类”。只有当模型真正理解了杯子为什么会碎、人为什么会笑、视频里的人在做什么动作,它才能在现实世界中可靠地执行任务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雷锋在长江大桥下的罕见留影,穿戴干净整齐、清爽帅气、招人喜爱

雷锋在长江大桥下的罕见留影,穿戴干净整齐、清爽帅气、招人喜爱

云霄纪史观
2026-01-23 03:48:21
让中国光刻机“变成废铁”?日本痛下杀手,外媒:局势彻底反转!

让中国光刻机“变成废铁”?日本痛下杀手,外媒:局势彻底反转!

刘旷
2026-02-15 16:46:06
全新MacBook来了:苹果把iPhone芯片塞进笔记本里 性价比暴增

全新MacBook来了:苹果把iPhone芯片塞进笔记本里 性价比暴增

快科技
2026-02-16 10:58:44
毛主席最豁达最有风骨的一首词,几乎人人会背

毛主席最豁达最有风骨的一首词,几乎人人会背

格命草
2026-02-16 13:03:22
30多岁中国籍女子从韩机场前高架桥坠亡:穿过马路后坠落,尚未完成离境手续

30多岁中国籍女子从韩机场前高架桥坠亡:穿过马路后坠落,尚未完成离境手续

红星新闻
2026-02-15 12:00:15
林肯汽车,还能挺过明年吗?

林肯汽车,还能挺过明年吗?

汽车K线
2026-02-14 09:16:15
女子深夜打车回家,发现司机绕路她准备报警,司机:你仔细看后面

女子深夜打车回家,发现司机绕路她准备报警,司机:你仔细看后面

千秋文化
2026-02-12 20:06:26
资本主义制度的不治之症——失业 1976年2月4日《人民日报》

资本主义制度的不治之症——失业 1976年2月4日《人民日报》

那些看得见的老照片
2026-02-04 20:20:03
广东“早餐之王”肠粉,为何外地人不想吃第2次,4大原因太真实了

广东“早餐之王”肠粉,为何外地人不想吃第2次,4大原因太真实了

餐饮新纪元
2026-01-08 07:12:35
埃及转变立场:不买俄苏35中歼10,选中国4000万新军机

埃及转变立场:不买俄苏35中歼10,选中国4000万新军机

仙味少女心
2025-12-24 00:57:50
怪不得解放军不拦,国民党发现不对劲,美国售台坦克果然有问题!

怪不得解放军不拦,国民党发现不对劲,美国售台坦克果然有问题!

一簌月光
2026-02-16 13:06:51
宁德时代盘初涨幅扩大至3.0%

宁德时代盘初涨幅扩大至3.0%

每日经济新闻
2026-02-16 09:54:04
马英九言论引关注:统一最后时刻,大陆准备战争,台美需深思

马英九言论引关注:统一最后时刻,大陆准备战争,台美需深思

领悟看世界
2026-02-15 01:21:14
为什么印度男人,如此性饥渴?

为什么印度男人,如此性饥渴?

透视到底
2026-02-13 02:06:10
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
南京Lily姐火了。
​38岁陪读妈妈,牵着70岁德国工程师的手

南京Lily姐火了。 ​38岁陪读妈妈,牵着70岁德国工程师的手

岁月有情1314
2026-02-05 11:13:16
英国女子服减肥药后确诊罕见巨乳症,胸部疯长至35斤

英国女子服减肥药后确诊罕见巨乳症,胸部疯长至35斤

扬子晚报
2026-02-09 21:56:11
中戏原表演系主任陈刚主动投案的消息引热议,他的妻子身份被扒出

中戏原表演系主任陈刚主动投案的消息引热议,他的妻子身份被扒出

魔都姐姐杂谈
2026-02-15 18:46:50
“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

妙知
2026-01-22 16:41:19
588万平方公里!沙俄抢走的中国故土,如今竟成为世界最大荒原

588万平方公里!沙俄抢走的中国故土,如今竟成为世界最大荒原

白色得季节
2025-12-30 21:08:45
2026-02-16 18:52:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2223717文章数 5488关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw之父 承诺开源绝不动摇

头条要闻

春晚节目单公布:一共3个小品 没有相声

头条要闻

春晚节目单公布:一共3个小品 没有相声

体育要闻

遭针对?谷爱凌炮轰国际雪联安排

娱乐要闻

好甜蜜!郭富城随方媛回安徽过年

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

旅游
本地
艺术
公开课
军事航空

旅游要闻

文旅贺新岁!济南新春灯会全域点亮,多点联动

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

孙过庭又一草书真迹被发现,完完整整5000多字,至今只公开展出过一回!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版