网易首页 > 网易号 > 正文 申请入驻

字节跳动:Seedance 2.0正式发布,音视频生成质量和可控性达专业生产场景要求

0
分享至

2 月 12 日,据字节跳动 Seed 官方微信公众号消息,今天,新一代视频创作模型 Seedance 2.0 正式发布。

Seedance2.0 采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入,集成了目前业界最全面的多模态内容参考和编辑能力。相比1.5 版本,Seedance 2.0的生成质量大幅提升,其在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性显著增强,更加贴合工业级创作场景的需求。

其核心亮点如下:

复杂场景下更高可用率:凭借出色的运动稳定性和物理还原能力,模型在多主体交互和复杂运动场景中表现出色,生成可用率达到业界 SOTA 水平。

多模态能力显著强化:基于统一的多模态音视频联合架构训练,支持混合模态输入,允许用户同时输入多达 9 张图片、3 段视频、3 段音频以及自然语言指令,模型可参考输入素材中的构图、动作、运镜、特效、声音等元素,打破传统视频生成的素材边界。

视频生成可控性大幅提升:模型的指令遵循与一致性表现全面提升,并支持稳定可控的视频延长、视频编辑,让普通用户也能像导演一样,轻松掌控视频创作全流程。

深度支持工业级内容创作:模型支持 15 秒高质量多镜头音视频输出,具备双声道音频能力,可实现极致拟真的视听效果,配合参考和编辑能力,能大幅降低影视、广告、电商、游戏等场景的内容制作成本。

字节跳动称,依靠海量世界知识、稀疏架构的效能优势,以及多模态联合训练涌现的强大泛化能力,Seedance 2.0 解决了物理规律遵循及长效一致性的难题,同时也赋予创作者前所未有的自由度,让音视频生成的质量和可控性达到专业生产场景要求。

不过字节跳动也指出,Seedance 2.0 还远不完美,其生成结果仍存在诸多瑕疵。未来,我们将持续探索大模型与人类反馈的深度对齐,让更高效、更稳定、更具想象力的音视频生产工具,服务更多创作者。

目前,Seedance 2.0 已上线即梦 AI、豆包等平台。

IT之家附官方详细介绍如下:

拟真视听效果和导演级操控,让音视频生成“所想即所见”

凭借基础能力和多模态效果的跃升,Seedance 2.0 将为用户带来全新的创作体验。

Seedance 2.0 能完成前代模型难以实现的多人竞技运动生成,音频效果更加自然沉浸,输入也不再局限于单一的文字或图片,创作过程更自然、高效,让用户能像真正的“导演”一样掌控创作。下面,我们将具体介绍其能力特点。

1.稳定呈现复杂运动和交互,真实还原物理规律

Seedance 2.0 的生成表现显著提升,尤其在人物动作建模方面展现出此前未有的自然性、连贯性与物理合理性。

它能高保真地合成时序精密的复杂交互场景,比如在双人花滑场景中,模型较好地演绎了同步起跳、空中旋转、精准落冰等一系列高难度动作,同时,生成过程保持了对现实世界运动规律的遵循,避免了以往 AI 视频常见的物理谬误。

在更细腻的特写镜头中,无论是微妙的光影折射变化、衣物随风颤动时所呈现的重力感,还是人物与环境之间自然流畅的交互动作,模型生成的画面均展现出高度逼真的细节与严密的物理逻辑,宛如真实实拍。

2.支持多模态“全能参考”,创作自由度大幅提升

Seedance 2.0 支持多模态全能参考,允许组合输入不同文本、图片、视频、音频。模型可精准理解多模态输入内容,并按指令要求参考其画面构图、镜头语言、动作节奏、音效特点等元素进行生成,甚至可以直接参考文字分镜内容,创作自由度大幅提升。

3.更强可控性,精准遵循生成和编辑指令

Seedance 2.0 视频生成的可控性也大幅提升。其指令遵循表现出色,即便面对包含大量角色互动和精细动作描述的复杂脚本,也能做到精准还原生成,并保持稳定的主体一致性。同时,模型还具备一定的编导思维,可自主规划镜头语言,并设计视觉呈现模板。

4.双声道音频能力,高仿真沉浸音效同步生成

Seedance 2.0 还升级了音频能力,集成双声道立体声技术,可实现高仿真、沉浸式的音效生成。模型支持背景音乐、环境音效或人物解说等音频多轨并行输出,精准对齐画面节奏。

同时,模型的音效设计高度自然,能真实还原磨砂玻璃轻刮声、毛绒织物揉搓声、亚克力板轻敲声、气泡纸轻捏声等细腻音效,强化场景沉浸感。配合严格的音画时序控制,确保音频与视觉动作严丝合缝,可以更好地支持专业级视听内容创作。

5.全场景广泛适配,降低专业内容制作门槛

针对视频内容生产的多元化需求,Seedance 2.0 展现出极高的场景适配性。无论是商业广告、影视特效,还是游戏动画、解说视频,模型均能提供高质量的生成效果。

通过 AI 生成替代复杂的特效制作和实拍流程,Seedance 2.0 可大幅度降低专业音视频内容的制作成本,缩短生产周期,帮助创作者和企业更好地落地创意。

Seedance 2.0 评测结果,综合表现达到行业领先

为客观全面地评估Seedance 2.0在多模态场景的综合能力,团队协同影视领域的专家,建立了覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。本次评估重点考察模型在多模态参考生成、复杂音视频指令遵循、复杂运动稳定性、专业镜头语言、音视频表现力及视听一体化协同等维度的表现。

1.文生视频、图生视频评测

在视频维度,Seedance 2.0 处于业内领先水平。其运动稳定性、指令遵循及画面美感维度均有显著提升,有效改善了结构准确性和崩坏问题,生成的复杂动作流畅细腻。模型可精准呈现高张力大动作与精细的微表情,并支持专业级组合运镜与叙事节奏控制。

针对长脚本及开放性指令,模型能较好响应并合理发挥。同时,其生成视频具有一定的影视化美感,物体材质、光影构图及服化道设计均表现出较好的完成度。不过,Seedance 2.0 仍需持续改进细节稳定性、拟真度及动态生动性。

在音频维度,Seedance2.0依然表现强劲,音频表现力大幅提升。其双声道音频层次丰富、细腻,并可根据场景匹配更适合提示词情境的音效或曲调旋律。相比上一版本,模型的视听一体化体验进一步强化,台词、音效、背景音乐和画面内容更加契合,同时,针对中文方言、戏曲及演唱场景,其指令响应准确度明显提升。不过,Seedance2.0 仍需继续解决多人口型匹配、偶现音频失真等问题。

Seedance 2.0 文字生成视频能力评测

Seedance 2.0 图片生成视频能力评测

2.多模态参考生成评测

Seedance2.0有着行业领先的综合表现。模型覆盖的参考任务更全面,支持多模态参考生成、视频编辑、视频延续等多种创作场景。同时,其对参考内容的理解深度和响应精度具备优势,在编辑任务中,相比其他模型,Seedance2.0指令响应更加完整,生成画面更加真实。在一致性表现上,模型在主体形象与声音还原方面表现相对较好,尤其在动作逻辑、特效风格及剧情叙事的参考一致性上显著占优。不过,模型在多主体一致性、文字还原精度及复杂编辑效果上,仍有优化的空间。

Seedance 2.0 多模态任务表现评测

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
急了!印度最近为啥拼命要和中国谈边界?再拖就真没机会了

急了!印度最近为啥拼命要和中国谈边界?再拖就真没机会了

趣生活
2026-02-16 20:18:37
狗血!中戏王鑫主动投案,共4位表演系主任落马,闫学晶的天塌了

狗血!中戏王鑫主动投案,共4位表演系主任落马,闫学晶的天塌了

壹月情感
2026-02-13 23:30:13
四个省级党委领导班子调整

四个省级党委领导班子调整

滨州日报
2026-02-17 09:02:57
中央重拳打击鼓吹不婚不育歪风,生孩子才是正道,紧迫作务

中央重拳打击鼓吹不婚不育歪风,生孩子才是正道,紧迫作务

老猫观点
2026-02-16 18:34:42
国防部终于回应:中国确实在建造核动力航母?全球目光立即聚焦

国防部终于回应:中国确实在建造核动力航母?全球目光立即聚焦

阿芒娱乐说
2026-02-16 12:46:56
东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

品读时刻
2026-02-14 09:03:05
英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

英媒:中国将中子弹纳入常规装备,若属实,代理人战争算是废了

我心纵横天地间
2026-01-29 15:24:36
彭德怀问解方:土耳其旅是何物?了解后下令,让三十八军给我全歼

彭德怀问解方:土耳其旅是何物?了解后下令,让三十八军给我全歼

掠影后有感
2026-02-07 12:22:51
真不敢去北方过年了,广东女子吐槽东北春节,直呼男人见了都怕

真不敢去北方过年了,广东女子吐槽东北春节,直呼男人见了都怕

半身Naked
2026-02-16 12:51:18
你知道什么是降维打击吗?网友:符合高中学历的认知

你知道什么是降维打击吗?网友:符合高中学历的认知

带你感受人间冷暖
2026-02-13 21:51:11
萨拉赫终于妥协!利物浦两大核心并肩作战,斯洛特帅位稳了?

萨拉赫终于妥协!利物浦两大核心并肩作战,斯洛特帅位稳了?

锐评利物浦
2026-02-16 23:44:47
军委让张万年参加香港回归仪式,张万年:这不行

军委让张万年参加香港回归仪式,张万年:这不行

文史茶馆2020
2026-02-10 08:36:59
特朗普下达最后通牒,要求台当局立即付款,否则将延期对台军售

特朗普下达最后通牒,要求台当局立即付款,否则将延期对台军售

福建平子
2026-02-17 11:00:58
飞机懵了,高铁呆了,万万没想到,今年春运出风头的是绿皮火车

飞机懵了,高铁呆了,万万没想到,今年春运出风头的是绿皮火车

深度报
2026-02-15 23:00:51
内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

品读时刻
2026-02-11 17:18:30
日本撕破体面,对着王毅只敢憋出这一句!

日本撕破体面,对着王毅只敢憋出这一句!

娱乐督察中
2026-02-17 10:32:39
同样练葵花宝典,为何东方不败超一流水平,岳不群、林平之却很菜

同样练葵花宝典,为何东方不败超一流水平,岳不群、林平之却很菜

武侠百晓生
2026-02-16 22:23:43
杨采钰晒除夕美照!婚后第一年在婆家过吃的好丰盛,老公出镜超帅

杨采钰晒除夕美照!婚后第一年在婆家过吃的好丰盛,老公出镜超帅

乐悠悠娱乐
2026-02-16 19:28:39
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
除夕夜,陈吉宁“四不两直”检查城市运行保障和节日值班值守,看望慰问一线工作人员

除夕夜,陈吉宁“四不两直”检查城市运行保障和节日值班值守,看望慰问一线工作人员

上观新闻
2026-02-16 23:47:07
2026-02-17 11:48:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545935关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

蔡磊一家三口出镜送祝福 儿子将手放在他手上轻轻抚摸

头条要闻

蔡磊一家三口出镜送祝福 儿子将手放在他手上轻轻抚摸

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春晚三大感人瞬间:周深于和伟上榜

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

旅游
房产
本地
艺术
公开课

旅游要闻

和县光影秀点亮新春佳节

房产要闻

三亚新机场,又传出新消息!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

这幅字调查百人,无人识别,竟如此难懂!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版