网易首页 > 网易号 > 正文 申请入驻

豆包 2.0 模型发布,全信息整理(全网最完整,另附 79 页 Model Card)

0
分享至

今天 Seed2.0 全系列正式发布
Seed2.0,也就是豆包大模型2.0(Doubao-Seed-2.0)

包括 Pro、Lite、Mini 三款通用 Agent 模型加一个 Code 模型,围绕 Agent 使用和大规模生产,做了系统性优化

先看数据(本文里所有表格,都是我做的,好不好看!!!)


Seed2.0 核心评测数据总览|vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次过完核心部份:

多模态,数学与视觉推理 19 项基准 12 项第一,视觉感知、文档理解、长上下文大部分基准 SOTA,EgoTempo 超过人类分数

LLM 科学能力,HealthBench 第一,SuperGPQA 超 GPT-5.2,整体与 Gemini 3 Pro、GPT-5.2 相当;在深度研究上也取得了不俗的成绩

代码,有明显进步,部分高难基准与国际领先模型仍有差距

已上线,豆包 App 选「专家」模式 / TRAE 选「Doubao-Seed-2.0-Code」,全系列 API 已上线火山引擎,价格较同级 GPT 和 Claude 便宜一个数量级


Model Card 也有,同时发布的还有一份 79 页的 Model Card,公众号后台回复「Seed2.0」,获取这份 Model Card


先说定价

Seed2.0 全系列的这四款模型,API 已上线火山引擎。以下为分段计费中 ≤32k 输入的价格,单位元/百万 tokens,这里我也做了个对比图:


价格对比(人民币计价)

Pro(doubao-seed-2-0-pro-260215)旗舰全能,面向复杂推理与长链路 Agent 任务
输入 3.2 / 输出 16 / 缓存命中 0.64

Lite(doubao-seed-2-0-lite-260215)均衡型,综合能力超 Seed1.8,兼顾质量与速度
输入 0.6 / 输出 3.6 / 缓存命中 0.12

Mini(doubao-seed-2-0-mini-260215)低时延高并发,256k 上下文,4 档思考长度
输入 0.2 / 输出 2 / 缓存命中 0.04

Code(doubao-seed-2-0-code-preview-260215)编程加强版,适配 Claude Code 等 IDE 工具链
输入 3.2 / 输出 16 / 缓存命中 0.64

四款模型均支持文字、图片、视频输入,文字输出

token 定价,比海外模型低了约一个数量级。Agent 跑一次 workflow 消耗的 token 是人类对话的几十倍

在现实世界的复杂任务中,大规模推理与长链路生成将消耗大量 token,这个成本变量会越来越重


火山引擎模型详情页:https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的优化

Seed 团队分析了通用模型在 MaaS 服务中的真实调用情况


MaaS 调用场景分布

Seed 通用模型 MaaS 服务在中国大陆的调用场景分布,数据来自「火山方舟协作奖励计划」

最高比例的需求是处理混杂图表、文档等非结构化信息的知识内容。企业端的典型模式:先让模型做「读得多、想得多」的任务,再进入复杂且专业的流程型工作

基于这个真实需求,Seed2.0 重点优化三个方向:

  • 更稳健的视觉与多模态理解:复杂文档、表格、图形、视频内容的解析能力显著提升

  • 更可靠的复杂指令执行:多约束、多步骤、长链路任务的理解与执行能力强化

  • 更灵活的推理选择:Pro、Lite、Mini 三档加 Code 模型,覆盖不同场景

除了生产级需求,Seed2.0 还在推高模型智能上限。目前已经能从解决奥林匹克竞赛类问题迈向支持研究级推理,比如尝试探索埃尔德什级别的数学问题,也可以完成部分科学相关任务的编程工作

能解埃尔德什问题和能帮你整理一堆扫描版合同,是两种能力
Seed2.0 两个都在做

多模态理解:大部分基准 SOTA 数学与视觉推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等数学推理基准上达到业界最优水平。LogicVista、VisuLogic 等视觉解谜与逻辑推理基准上,较 Seed1.8 显著提升


数学与视觉推理评测数据

标注 * 的数据引自公开技术报告

视觉感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基准中取得业界最高分。面对不同类型的视觉输入时仍能保持准确且可信的感知和判断能力


视觉感知与通用 VQA 评测数据

标注 * 的数据引自公开技术报告

文档理解与长上下文

模型面对的,往往是复杂版式混排的原始材料。相比 Seed1.8,处理非结构化信息的能力显著强化,ChartQAPro 与 OmniDocBench 1.5 达到顶尖水准

长上下文方面,DUDE、MMLongBench、MMLongBench-Doc 均取得业界最佳分数


文档理解与长上下文评测数据

标注 * 的数据引自公开技术报告

视频理解

时间序列与运动感知方面,TVBench、TempCompass、MotionBench 等关键测评处于领先位置

EgoTempo 超过人类分数(人类 63.2,Seed2.0 Pro 71.8),对「变化、动作、节奏」的捕捉更为稳定

长视频场景中,Seed2.0 在大部分评测上超越了其他顶尖模型,可以高效准确地处理小时级别的长视频。视频工具 VideoCut 进一步提高了长视频处理的时长范围和推理精度

流式实时视频方面同样表现优异,能完成实时视频流分析、环境感知、主动纠错与情感陪伴,可应用于健身、穿搭等场景


视频理解评测数据

标注 * 的数据引自公开技术报告

LLM 与 Agent:真实长程任务执行能力提升

Seed 团队观察到一个典型失衡:模型已经可以顺利解决竞赛难题,但放在真实世界中,依然很难端到端地完成实际任务,比如一次性构建一个设计精良、功能完整的小程序

原因来自两点。真实世界任务跨越更长时间尺度、包含多个阶段,现有 LLM Agent 难以自主构建高效工作流。真实世界知识具有很强的领域壁垒且呈长尾分布,各行业的经验不在训练语料的高频区

长尾领域知识

Seed2.0 通过系统性加强长尾领域知识来应对

SuperGPQA 超过 GPT-5.2,HealthBench 第一名,科学领域整体成绩与 Gemini 3 Pro 和 GPT-5.2 相当。FrontierSci 等 STEM 基准表现突出,部分场景得分超过 Gemini 3 Pro


LLM 科学能力评测数据 指令遵循

Seed2.0 保持较强的一致性与可控性,为 Agent 模型在长链路、多步骤任务中严格按约束条件执行奠定了基础


指令遵循评测数据 深度研究

Seed2.0 在长链路任务中表现突出,尤其擅长连续完成「找资料、做归纳、写结论」这类连续工作流

三项深度研究评测,Pro 和 Lite 都取得了不俗的成绩


深度研究评测数据 真实世界任务

在具备直接经济价值的现实任务评测中,Seed2.0 在客服问答、信息抽取、意图识别、中小学阶段问题解答等高频场景上表现稳定。GDPVal-Diamond、XPert Bench 等复杂专业任务基准上同样取得有竞争力的结果


真实世界任务评测数据 科学发现

FrontierSci-research 等前沿科研基准上表现强劲,AInstein Bench 领先,体现出在科学发现场景中较强的假设驱动式推理能力


科学发现评测数据 从研究想法到实验方案

Seed2.0 还能把「研究想法」推进到「形成可落地的实验方案」

以高尔基体蛋白分析为例,模型把基因工程、小鼠模型构建、亚细胞分离与多组学分析串成一条完整流程,细化到关键环节怎么做、用什么做对照排除污染、用哪些指标评估纯度

相关领域专家的反馈:方案在跨学科的实验细节与步骤化表达上超出预期,能产出结构清晰、科学上相对可靠、具有可执行性的实验草案


高尔基体蛋白分析实验方案示例 代码:有进步,有差距

端到端整体代码生成、上下文学习方面取得了明显进步


Vibe Coding 及上下文评测数据

部分高难基准上,与国际领先模型相比仍有提升空间

最后

除了火山 API 之外,Seed2.0 Pro 和 Code 还已分别上线:

  • • 豆包 App:选择「专家」模式,开启对话

  • • TRAE:在「内置模型」中选择「Doubao-Seed-2.0-Code」

以及,火山的这个模型,也已上线方舟 Coding Plan,且首月低至 8.91 元

新春限时特惠 ✖️ 二月特别补贴

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被淘汰快10年突然翻红,销量暴涨20%!明星纷纷佩戴出镜,网友:我支持,便宜又好用

被淘汰快10年突然翻红,销量暴涨20%!明星纷纷佩戴出镜,网友:我支持,便宜又好用

都市快报橙柿互动
2026-04-01 22:21:20
我在印度开工厂,建了个现代化厕所,结果次日全镇的人几乎都来了

我在印度开工厂,建了个现代化厕所,结果次日全镇的人几乎都来了

千秋文化
2026-04-03 20:59:09
为什么“回迁房”突然没人买了?老住户坦言:越住越闹心!

为什么“回迁房”突然没人买了?老住户坦言:越住越闹心!

Home范
2026-03-27 13:17:26
沈阳又一大型洗浴入驻商场!

沈阳又一大型洗浴入驻商场!

沈阳百姓一家亲
2026-04-03 14:14:20
王晶再揭关之琳秘史!高尔夫球只是冰山一角,刘銮雄自爆真相太扎心

王晶再揭关之琳秘史!高尔夫球只是冰山一角,刘銮雄自爆真相太扎心

动物奇奇怪怪
2026-04-01 18:50:33
日本足球什么水平?8个世界杯冠军赢了7个,董路黄健翔各执一词

日本足球什么水平?8个世界杯冠军赢了7个,董路黄健翔各执一词

夏侯看英超
2026-04-03 21:28:31
菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

小丸说故事
2026-03-17 14:23:29
许家印,在恒大王国里,过足了官瘾、钱瘾、色瘾,金蝉脱壳玩死了

许家印,在恒大王国里,过足了官瘾、钱瘾、色瘾,金蝉脱壳玩死了

历史伟人录
2026-04-01 17:55:34
去了上海才发现:乐福鞋不兴了!满大街都是“阔腿裤+德训鞋”!

去了上海才发现:乐福鞋不兴了!满大街都是“阔腿裤+德训鞋”!

蓓小西
2026-04-04 09:02:39
头号种子惨遭1-7横扫,决赛首人呼之欲出

头号种子惨遭1-7横扫,决赛首人呼之欲出

铿锵格斗
2026-04-04 00:55:28
生日照藏玄机,提离婚掀桌子,赌王家族“恩爱剧本”演不下去了

生日照藏玄机,提离婚掀桌子,赌王家族“恩爱剧本”演不下去了

天马幸福的人生
2026-04-03 16:20:42
王炸级利好!

王炸级利好!

君临财富
2026-04-03 13:57:56
对比2.6吨车载重量只有375公斤,飞度才是遥遥领先,他们望尘莫及

对比2.6吨车载重量只有375公斤,飞度才是遥遥领先,他们望尘莫及

柏铭锐谈
2026-04-02 08:58:58
特朗普炒掉司法部长邦迪!美陆军参谋长也被要求立即辞职!白宫还被曝考虑解职更多高官,包括美联邦调查局局长、陆军部长、劳工部长

特朗普炒掉司法部长邦迪!美陆军参谋长也被要求立即辞职!白宫还被曝考虑解职更多高官,包括美联邦调查局局长、陆军部长、劳工部长

每日经济新闻
2026-04-03 10:02:08
这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

阿凫爱吐槽
2025-12-17 17:24:39
不打伊朗了?特朗普通告全世界,战争费由22国承担,朝鲜发出警告

不打伊朗了?特朗普通告全世界,战争费由22国承担,朝鲜发出警告

聊历史的阿稼
2026-04-01 09:54:30
广东东莞一加油站开业请4名礼仪穿紧身短裙助阵,当地市监局:不得低俗营销,已下发整改通知

广东东莞一加油站开业请4名礼仪穿紧身短裙助阵,当地市监局:不得低俗营销,已下发整改通知

大象新闻
2026-04-03 17:45:03
60败联盟首队!步行者惨负难阻黄蜂10战8胜 西亚卡姆30+7

60败联盟首队!步行者惨负难阻黄蜂10战8胜 西亚卡姆30+7

醉卧浮生
2026-04-04 09:18:09
张元英最新照脚真大,这得四十多码

张元英最新照脚真大,这得四十多码

情感大头说说
2026-04-04 03:02:36
CBA现役本土第一人!不是张镇麟和郭昊文,而是中国男篮定海神针

CBA现役本土第一人!不是张镇麟和郭昊文,而是中国男篮定海神针

蛋疼体育
2026-04-02 17:36:24
2026-04-04 09:43:00
赛博禅心
赛博禅心
拜AI古佛,修赛博禅心
358文章数 50关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

伊朗悬赏追捕美军飞行员 呼吁民众"看到他们就开枪"

头条要闻

伊朗悬赏追捕美军飞行员 呼吁民众"看到他们就开枪"

体育要闻

被NBA选中20年后,他重新回到篮球场

娱乐要闻

夏克立官宣再婚当爸?否认婚内出轨

财经要闻

刘纪鹏:只盼长慢牛,巩固4000点是关键

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

艺术
房产
本地
健康
公开课

艺术要闻

宋楚瑜题字引争议,“丑书风”到底有多火?你怎么看!

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

本地新闻

跟着歌声游安徽,听古村回响

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版