字节大模型，重磅发布！|豆包|模态|序列|新论文

字节大模型，重磅发布！

2026-02-14 15:52:25　来源: 证券时报

广东举报

分享至

在这个春节的“群模大战”中，作为“多模态AI王者”的字节跳动，接连惊艳市场。

2月14日，字节火山引擎发布豆包大模型2.0（Doubao-Seed-2.0）。据介绍，这是字节跳动最新推出的多模态Agent（智能体）模型，也是豆包大模型自2024年5月正式发布以来首次大版本的跨代升级。豆包大模型2.0具有更稳健的视觉与多模态理解、更可靠的复杂指令执行、更快速更灵活的推理选择三大核心亮点。目前，豆包2.0 Pro和Code模型已分别在豆包App和TRAE上线，同时，豆包2.0全系列模型API已同步上线火山引擎。

值得注意的是，在豆包2.0正式发布之前，豆包视频生成模型Seedance 2.0、豆包图像创作模型Seedream 5.0 Lite已分别在2月12日、2月13日正式发布。其中，视频生成模型Seedance 2.0更是全球爆火，以“1分钟生成好莱坞级大片”的炸裂效果，在海外舆论场引发轰动，并引爆了A股AI应用、文化传媒、短剧游戏等板块行情。

在业内人士看来，“基础模型+视频生成模型+图像创作模型”三大模型的跨代升级，彰显了字节跳动在多模态AI领域的技术领跑与全链路布局优势。

三大亮点，性能与智能水平再突破

2月14日，豆包大模型2.0正式发布。据字节Seed团队介绍，豆包2.0具有三大亮点：

一是更稳健的视觉与多模态理解：豆包2.0强化了视觉感知与推理能力，对复杂文档、表格、图形、视频内容的解析水平显著提升，视觉信息处理更精准。

二是更可靠的复杂指令执行：豆包2.0提升了指令遵循和推理表现，并强化了对多约束、多步骤、长链路任务的理解与执行能力，已具备支撑高价值任务的能力基础。

三是更快速、更灵活的推理选择：豆包2.0提供 Pro、Lite、Mini 三款不同尺寸的通用Agent模型，以及专门的Code模型，覆盖不同的场景需求，供企业和开发者选择。

豆包2.0全面升级了多模态能力，在各类视觉理解任务上均达到业界顶尖水平，其视觉推理、感知能力、空间推理与长上下文理解能力表现尤为突出，豆包2.0 Pro在大多数相关基准测试中取得了最高分数。

记者实测发现，豆包2.0在图片识别与理解、智能分析等方面表现优秀。例如，当记者输入一张蛋糕图片，询问图片中有几朵玫瑰、分别是什么颜色时，豆包2.0能精准罗列三类不同的玫瑰花色，并介绍其中一种渐变色的玫瑰为爱莎玫瑰品种。值得注意的是，豆包2.0还识别出其中一朵为洋桔梗，并未受到问题的误导。

“三箭”齐发，多模态能力全面升级

“太震撼了，Seedance 2.0的热度还没退却，全新的图像生成模型又登场，把AI生图从‘炫技玩具’变成了‘生产力神器’。”在体验了豆包图像创作模型Seedream 5.0 Lite后，一名AI创业公司的创始人如此感叹。

两年前的春节期间，Open AI的Sora横空出世；去年8月，谷歌推出的爆款图像编辑产品Nano Banana火遍全网。而此次豆包大模型的一系列重要升级，不仅涵盖了豆包大模型2.0，还包括此前发布的视频生成模型Seedance 2.0和图像创作模型Seedream 5.0 Lite。“三箭”齐发，实现多模态 Agent、AI 图像、AI视频创作全维度技术突破，被业界视为“枪挑Sora、硬刚Nano Banana”，彰显了字节跳动在多模态AI领域的技术领跑与全链路布局优势。

无论是Seedance 2.0还是Seedream 5.0 Lite，都更加注重实用性与易用性，以跨模态理解与参考为核心特色，赋予创作者更高的自由度。

以Seedream 5.0 Lite为例，得益于跨模态理解能力的提升，用户无需再绞尽脑汁写复杂的提示词，只需输入一张参考图，简单描述需求，模型就能理解并生成所需的图片风格。例如，向模型输入两张图片，简单撰写提示词“把图1色调改成图2的色调”，模型就能精准理解用户意图，生成图3的风格图片，极大地降低了创作门槛。

除了更强的理解和推理能力外，Seedream 5.0 Lite还具备实时检索能力，支持联网检索。例如，近期贵金属价格波动引发广泛关注，模型能基于实时检索结果，绘制出用户指定日期时段的金价走势图。

Seedance 2.0更是以“导演级AI”的视频生成模型，让视频生成“所想即所见”。用户只需要根据自己的创意构思，编写包含人物、构图、动作、运镜、对白等要求的详细提示词，或者上传相应参考图片，就可以得到带有原生音频的多镜头序列视频。

例如，当记者输入“帮我生成一个视频：在第一次华山论剑中，大熊猫和大猩猩切磋武艺。模型2.0，比例 16：9，时长 15s”的简单提示词后，一个可媲美动漫电影制作效果的视频便随即生成。

不少影视、短剧、游戏行业从业者在使用Seedance 2.0后，都表示“人均导演的时代到来了”。知名导演贾樟柯也在个人微博账号发文称：“Seedance 2.0确实厉害，我准备用它做个短片。 ”

引爆应用，产业链上下游同步受益

豆包大模型此次的系列重要升级，以卓越的性能、极强的多模态能力以及高度的可用性，引发业界广泛关注。业内评价，豆包大模型提供了一种极具成本效益的多模态大模型解决方案，推动前沿AI技术在千行百业规模化应用。

对于产业链而言，在豆包大模型的带动下，短视频营销、电商素材、AI漫剧、游戏制作、数字内容创作等下游应用场景需求有望迎来爆发。同时，华泰证券研报认为，AI极大降低了文字IP向视频内容转化的门槛，海量优质IP储备的公司将直接受益，上游IP方数字资产有望重估；中游制作方中，看好能高效结合AI工具赋能内容创作的公司，特别是拥有稀缺导演/编剧资源的公司。

此外，由于AI的规模化应用依赖强大的算力支持，伴随豆包大模型多模态能力全面落地与内容创作场景爆发，云端训练与推理算力需求将持续走高，有望带动AI 芯片、智能服务器、云计算服务等上游算力环节快速增长。

值得注意的是，字节跳动通过火山引擎对外提供豆包大模型服务，是豆包系列模型产业落地的核心载体。最新数据显示，截至2025年12月，豆包大模型日均使用量突破63万亿 Tokens，居中国第一、全球第三。2025年上半年，火山引擎在中国公有云上大模型调用量市场份额占比达49.2%。豆包大模型的重要升级，也将巩固火山引擎在AI云市场的领先地位，推动AI能力在各行各业的深度落地。

责编：叶舒筠

校对：祝甜婷

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.