智通财经APP获悉,2月12日,豆包视频生成模型 Seedance 2.0 正式发布,现已全面接入豆包和即梦产品,并上线火山方舟体验中心。Seedance 2.0 较好地解决了物理规律遵循及长效一致性等难题,同时也赋予创作者前所未有的自由度,让视频生成质量和可控性达到专业生产场景要求。目前,Seedance 2.0 限制了真人图像/视频作为主体参考。如需使用真人作为主体参考,须经本人验证或取得授权。
01.导演级操控,让视频生成“所想即所见”
稳定呈现复杂交互和运动:Seedance 2.0 在运动场景下的生成可用率达到业界 SOTA 水平,其在人物动作建模方面,有着自然连贯、遵循现实世界运动规律的显著优势。它能高保真地合成时序精密的复杂交互场景,也能在特写镜头中展现出高度逼真的细节与严密的物理逻辑,宛如实拍。
多模态全能参考:支持文字、图片、音频、视频四种模态混合输入,模型可参考输入素材中的构图、动作、运镜、特效、声音等元素,大幅提升创作自由度。
指令遵循与可控性全面提升:Seedance 2.0 能精准还原复杂脚本,保持稳定的主体一致性。模型还具备一定的编导思维,分镜设计和运镜贴合叙事逻辑。此外,Seedance 2.0 新增了视频编辑和视频延长能力,每位用户都能像导演一样掌控全场。
高仿真沉浸音效同步生成:集成双声道立体声技术,可实现高仿真、沉浸式的音效生成。模型支持背景音乐、环境音效或人物解说等音频多轨并行输出,精准对齐画面节奏,更好地支持专业级视听内容创作。
广泛适配各类生产场景:无论是商业广告、影视特效,还是游戏动画、解说视频,模型均能提供高质量的生成效果。预计在2月中下旬,Seedance 2.0 的 API 服务将上线火山方舟,帮助企业客户更好地落地创意。
02.Seedance 2.0 评测:综合表现行业领先
为全面评估模型在多模态场景的综合能力,字节跳动 Seed 团队协同影视领域的专家,建立了覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。
![]()
文生视频能力评测
![]()
图生视频能力评测
![]()
多模态参考生成评测
在各项评测中,Seedance 2.0 的综合表现达到行业领先水平。但与此同时,模型在细节稳定性、多人口型匹配、多主体一致性、文字还原精度和复杂编辑效果等方面仍有优化空间。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.