田丰：中国“Seedance时刻”，将颠覆好莱坞|周鹏|电影|制作人|田丰(演员)|seedance

分享至

该图片可能由AI生成

图：黑客帝国版“田丰说”（Seedance2.0生成）

田丰锐评

马年春节前夕，字节发布了视频生成大模型Seedance2.0，热度很高，快思慢想研究院院长、特邀评论员田丰接受《中国新闻周刊》记者采访，精彩观点如下：

《中国新闻周刊》记者提问1：和同类模型如谷歌Veo、可灵3.0等比较，Seedance2.0是否在能力方面断层领先？其最主要的优势是什么？

田丰：

经过快思慢想研究院上手亲测，Seedance2.0产出的视频效果确实是“遥遥领先”，核心竞争优势在于"导演级"的可控性，因此Seedance2.0被《黑神话：悟空》制作人冯骥评价为"当前地表最强视频生成模型，没有之一"。与竞品相比，显著优势体现在：

1）多模态参考技术：Seedance2.0支持文本、图像、视频、音频四种模态输入（最多12路参考素材），而竞品A仅支持首尾帧，竞品B仅支持文生视频和图生视频。在实测中，Seedance2.0能精准复刻参考视频的运镜、动作节奏和特效，实现"指哪打哪"的精确控制。

2）音画精准同步：采用双分支扩散变换器架构（Dual-branch Diffusion Transformer），实现视频与音频的联合生成，口型匹配精度达毫秒级，支持8种方言对口型，而谷歌Veo在音画同步方面仍存在明显滞后，这将增加视频加工成本与时间。

3）镜头连贯性：通过ROPE位置编码技术优化多镜头切换，解决"角色突变"问题，实测可用率超90%。相比之下，竞品A在人物一致性上仍有明显缺陷，竞品B在人物换装问题上表现欠佳。

4）视频生成效率：Seedance2.0生成2K高清视频的速度比同类竞品快约30%，可在60秒内生成带有原生音频的多镜头序列视频，且可以并行生成多个视频，而竞品生成单视频通常需要数分钟。

中美AI视频技术差距已达2代，Seedance2.0不仅在技术层面领先，更在工业化落地能力上实现了"弯道超车"。

该图片可能由AI生成

图：Seedance2.0 网友作品

《中国新闻周刊》记者提问2：Seedance2.0如何做到技术领先？是其模型训练方式有别，还是模型本身有所突破？

田丰：

快思慢想研究院认为，Seedance2.0的技术领先源于其底层架构的革命性突破，而非简单的参数优化，核心突破在于三个关键创新点：

1）双分支扩散变换器架构（Dual-branch Diffusion Transformer）

传统模型采用"先生成画面、后匹配音频"的模式，导致音画脱节，更无法根据视频与虚拟摄像机的相对位置调整音量大小。Seedance2.0将视觉生成与音频生成分为两个独立分支，同时进行训练与融合，实现音画的原生协同，比如飞驰汽车的轮胎特写应有巨大的引擎轰鸣声、轮胎摩擦地面的声音，虚拟摄像机离远时声音逐步变小。这一架构使模型能同时处理视觉细节与音频节奏，避免了"先生成视频、再匹配音频"的滞后性。

2）原生多模态对齐

Seedance2.0在训练阶段就将视觉、听觉、文本等多模态信号深度融合，让模型理解不同模态之间的关联逻辑，实现"确定性生成"。传统AI视频模型的随机性，源于视觉与听觉信号的分离训练，导致画面逻辑断裂、音画脱节。Seedance2.0在训练阶段就将视觉、听觉、文本等多模态信号深度融合，让模型能够理解不同模态之间的关联的逻辑关系，从而实现“确定性生成”——只要输入明确，就能稳定输出符合预期的内容。

3）ROPE位置编码技术

针对多镜头切换时"跳戏"的痛点（竞品大多存在该问题），Seedance2.0引入ROPE位置编码技术，优化了镜头之间的衔接逻辑，让模型能够记住不同镜头中的角色特征、场景细节。该技术相当于给模型植入了"记忆功能"，避免了镜头切换时出现角色外貌、场景氛围的突变，而突变（比如道具变形或消失）往往带来令人厌恶的“不真实感”。

以上这些技术突破使Seedance2.0从"玩具级工具"升级为"工业级生产装备"，实现了从"生成画面"到"导演思维"的跨越，我们已经在Seedance2.0上重现了田老师数字人分身的《黑客帝国》、《恶灵骑士》同款运镜。

该视频可能由AI生成

视频：恶灵骑士版“田丰说”（Seedance2.0生成）

《中国新闻周刊》记者提问3：Seedance是否真的解决了“抽卡”问题？

田丰：

是的，Seedance2.0大幅减少了"抽卡"频率，解决了行业顽疾。"抽卡"是AI视频生成行业的传统痛点，由于AI生成的视频画面具备随机性，用户需要同一提示词使用多次，才能得到相对满意的一版结果，往往是十里挑一，业内俗称"抽卡"，单个镜头的抽卡次数可以高达7次以上。“抽卡次数”即视频成本（Tokens费用），因此可做如下推理测算：

1）Seedance 2.0模型更高的可控性有助于减少抽卡成本，从而降低漫剧行业的制作成本和制作周期。

2）如果Seedance 2.0可以使抽卡频率降低至原本的50%，则可以令模型每秒生成成本相比同业降低37%。

3）行业平均需7次生成才能获得可用视频，Seedance 2.0将单次生成可用率提升至90%以上，降本幅度达37%-68%。

在我们实测中，Seedance2.0的可用率已超过90%，而行业平均水平仅为20%左右。这意味着创作者平均只需生成1-2次即可获得满意结果，大幅降低了创作成本和时间，对普通用户来说堪称“惊艳”。

该图片可能由AI生成

图：Seedance2.0 网友作品

《中国新闻周刊》记者提问4：Seedance的技术水平是否会很快被超越？如何避免这一应用如流星般消逝？

田丰：

Seedance2.0的技术优势短期内难以被国内外竞争对手超越，而持续创新是保持领先的关键法则。

1）大规模采购芯片：Seedance2.0的领先优势主要源于字节跳动的"算力基建"。2026年，字节跳动计划在AI基础设施领域的资本支出约为1600亿元人民币。这一规模在国内十分领先，相当于腾讯同年相关投入的2倍，也高于阿里巴巴的年均投入水平。该预算中约一半（850亿元）将专项用于采购AI芯片。采用"饱和式攻击"策略使字节跳动能够以资源密度形成竞争壁垒。当其他公司仍聚焦于算法优化时，字节跳动已借助算力规模攻克了诸多技术瓶颈。

2）自研芯片：与Google、马斯克xAI类似，字节跳动正在推进自研AI芯片布局，代号"SeedChip"的自研AI芯片项目，2026年度目标产量为10万颗，若成功量产，单卡成本有望下降30%至50%，进一步巩固成本优势。

为避免"流星般消逝"昙花一现，字节跳动正采取以下策略：

（1）持续投入算力建设，2026年AI基础设施投入1600亿元。

（2）推进自研芯片（SeedChip）布局。

（3）优化多模态融合与用户体验。

（4）深度整合字节系生态，如将Seedance2.0融入即梦、小云雀等，导入大量存量用户群体。

因此，中国领跑的关键在于以多模态工业化落地能力实现“弯道超车"，字节正在跻身于全球顶尖的“AI应用超级工厂”。

该图片可能由AI生成

图：Seedance2.0 网友作品
《中国新闻周刊》记者提问5：有分析称，在Seedance加持下5秒特效镜头的制作成本已从3000元降至3元，您是否有观察到类似的数据？其究竟会带来多少成本缩减？

田丰：

是的，这一数据有据可查，且成本缩减幅度远超预期。正如业界测试者所说，5秒特效镜头成本从3000元降至3元，5分钟视频成本压缩至千元级，产能提升超千倍。传统特效镜头月均成本约3000元，而Seedance 2.0生成2分钟视频仅需3元；90分钟影片制作成本从万元级降至2000元级。咱们来拆解具体成本缩减：

1）传统短剧单集制作成本约5万元，5秒特效镜头成本高达3000元。Seedance2.0下，5秒特效镜头成本降至3元，5分钟视频成本压缩至1000元左右，这已经达到网剧、漫剧的自动化生产“甜点”，将彻底引爆“AI短剧”大爆发。

2）产能提升超千倍：传统制作周期为数月，Seedance2.0可将单部制作周期压缩至20天。若抽卡频率降低至原本的50%，模型每秒生成成本相比同业降低37%。若抽卡频率降低至原本的75%，则可降低总生成成本约5%。因此，Seedance2.0不仅降低了单个镜头的成本，更大幅提升了整体产能，为视频内容创作带来了革命性变化。

该图片可能由AI生成

图：Seedance2.0 网友作品

《中国新闻周刊》记者提问6：目前即梦官方限制了真实人脸的上传，您认为出于什么考虑？AI创作会有怎样的风险，是否应该有更清晰的边界？

田丰：

限制真实人脸上传是出于防范深度伪造风险的必要举措，AI视频创作确实存在重大安全隐患，需要建立清晰的边界。Seedance2.0模型可凭上传的单张照片、念几个数字的声音采样，就能逼真复刻真人形象、声线及动作习惯，不仅五官一模一样，而且精细到胡子茬、青春痘瘢痕等微小细节，如果被黑客利用伪造诈骗视频，将对不懂技术的百姓产生财产损失。目前，字节已紧急暂停真人素材参考功能，并强制标注AI生成内容。

AI视频创作的主要风险包括：

1）深度伪造风险：可精准复刻真人形象、声线及动作习惯，用于诈骗、诽谤等非法活动。

2）版权与合规风险：训练数据涉及海量公开素材，比如明星视频、千万粉丝网红视频等，存在版权纠纷隐患。

3）社会伦理风险：可能导致虚假信息泛滥，影响社会稳定。

为防范这些风险，快思慢想研究院强烈建议建立以下安全边界：

1）强制AI内容标注：所有AI生成内容必须明确标注"AI生成"，甚至对老人小孩、残障人士等辨识力不高群体采用“AI生成”示警声音。

2）限制敏感内容输入：如真人面部、特定名人形象等，本人授权同意AI生成除外，即形成AI名人分身二创的“白名单”与“黑名单”，即使同意也应建立起“停止底线”，比如生成色情、恐怖等引人不适的视频。

3）建立内容审核机制：对高风险内容进行人工审核，同时训练AI审核师持续提升其审核辨识能力，以避免过长审核时间对百姓学习AI技能的热情，与海量作品爆发挑战。

4）制定行业标准：推动AI生成视频内容的规范化、标准化。

正如字节跳动已采取的措施，"紧急暂停真人素材参考功能，并强制标注AI生成内容"，这是负责任的技术发展路径，“可信AI”来自“可控AI”。

该图片可能由AI生成

图：Seedance2.0 网友作品

《中国新闻周刊》记者提问7：未来随着AI创作门槛降到极低，所有人都能成为导演，那么人类创作的核心价值是什么？

田丰：

1）AI能“无限模仿”不等于能“无限创造”：比如新光影风格、新运镜、新服化道、新武术动作、新人物微表情等等，科技平权带来人人皆是“电影制片厂”，但产出的是电影工业艺术品，还是电影工业垃圾，大众观看后高下立见。

2）AI将从"技术密集型"转向"创意密集型"：人类创作的核心价值将从技术执行转向创意与情感表达。《黑神话：悟空》制作人冯骥认为：“未来传统团队或成非遗手工作坊。"简言之，人类创作的核心价值将体现在“创意策划”，AI能执行技术层面、给人类带来各种奇思妙想的“线索”，但核心创意构思仍需人类主导。另外，情感表达方面，AI难以理解并表达复杂情感，人类创作者能带来更具层次感的丰富情绪，与更深的情感共鸣。

3）文化理解的人机对齐：AI对东西方数千年历史文化背景的理解有限，甚至有误，AI偏见由此产生，比如何为美是多种多样的，并没有标准答案。人类能更准确地传递文化内涵、审美眼光。人类也能帮助AI做出伦理判断纠错，AI缺乏道德判断能力，人类需在创作中融入世界多元化伦理考量，一方水土养育一种社会伦理与民族美学。当AI学会了“文史哲记忆”和“世界逻辑”，视频生成才算真正走出了“抽盲盒”的原始阶段。

AI将解放创作者，使其从技术执行中解放出来，专注于更高层次的伟大创意与内心表达。 未来，AI将成为"导演助手"，而人类创作者将从"技术执行者"升级为"创意策展人"、“艺术思想家”，内容创作的核心价值将从技术实现转向创意表达与情感共鸣。

Seedance2.0的问世，标志着AI视频创作进入"导演级"新时代，中国在AI视频领域的技术实力已实现全球领跑。这一技术突破不仅将大幅降低视频创作成本、缩短制作周期，更将重塑整个内容创作产业的格局。随着AI技术的持续演进，我们期待看到更多伟大的东方AI创新应用，但同时也需审慎应对技术带来的新型伦理与社会挑战。正如《黑神话：悟空》制作人冯骥所言，AI不是取代人类创作者，而是赋能人类，让我们能够更专注于创意的表达与情感的传递。

该图片可能由AI生成

新闻正文

《中国新闻周刊》：是时候“颠覆好莱坞”了？

新闻网址：

https://mp.weixin.qq.com/s/61u8g-y7HczuiIINEoBFKw

一句话打造一个视频的时代

或许真的到来了

一张男人奔跑的图片，距离一个有运镜、背景音，和实物碰撞的电影级逃亡片段有多远？

该视频可能由AI生成

Seedance 2.0官方生成的电影级逃亡片段

2月12日，字节跳动正式上线新一代AI视频生成模型Seedance 2.0，并接入旗下生成式AI创作平台“即梦”以及豆包App。几天前，Seedance 2.0开启内测，其前序模型为诞生于去年6月的Seedance 1.0。于是，实现上述变换只需这样一句表述：“镜头跟随黑衣男子快速逃亡，后面一群人在追，镜头转为侧面跟拍，人物惊慌撞倒路边的水果摊爬起来继续逃，人群慌乱的声音。”

内测开启的几天里，抖音等众多国内外社交媒体和短视频平台被Seedance 2.0生成的视频“攻占”，许多海外创作者在X平台上发帖，寻求以+86开头的手机号，用以体验Seedance 2.0。在官方使用手册上，Seedance 2.0自称为“杀死比赛（kill the game）”的一代模型。

2月12日，埃隆·马斯克在社交平台上点评，“这发生得也太快了（It's happening fast）”。贾樟柯也在个人微博账号发文称：“Seedance 2.0确实厉害，我准备用它做个短片。”有美国导演称，“这没准会颠覆好莱坞”。多位受访者向《中国新闻周刊》指出，AI视频生成领域竞争激烈。美国谷歌的Veo 3.1模型此前领跑全球，OpenAI的Sora 2以及快手于2月5日上线的可灵3.0模型都各有千秋。然而，Seedance 2.0或许已颠覆这一格局，它在角色一致性、物理真实性等方面“一骑绝尘”。

一句话打造一个视频的时代，或许真的到来了。

不再“抽卡”？

2月10日，周鹏的父亲在抖音平台上发布了一个由Seedance 2.0制作的视频，内容是打斗场面，短短几天内便获得超过百万播放量，以及4000多赞。

“没有人指导，我爸自己靠一个视频‘起号’了。这样的例子还不少。”周鹏现在是全职AI视频创作者，也是最早一批体验Seedance 2.0的用户。他告诉《中国新闻周刊》，Seedance 2.0在AI和自媒体创作圈内爆火，源于其模型能力的大幅跃升。

最显著的便是物理一致性。Seedance 2.0单次输出视频时长不超过15秒，周鹏说，要让视频中的主要人物在所有切换视角的镜头里都保持形象一致，且维持15秒，非常不容易。以往的AI视频，往往存在人物面容衣着变化、表情与情绪不符、身体重心错误、与环境互动不自然等痕迹。除人物外，复杂物品零部件例如车辆后视镜等，也常在不同镜头中出现又消失，很难保持一致。

而Seedance 2.0在这方面的表现令人惊讶。“它能最大程度符合真实物理规律。”周鹏表示，打斗场景涉及许多物理规律，模型“翻车率”很高，但在近乎白话的提示词和参考视频的条件下，Seedance 2.0生成的招式动作细致，人物的走位合理，受击反馈也很真实。也就是说，AI视频真正开始“以假乱真”了。

要做到这一点，首先需要多模态输入。Seedance 2.0 目前支持图像、视频、音频、文本四种模态输入，最多支持12条上传素材。快思慢想研究院院长田丰告诉《中国新闻周刊》，在实测中，Seedance 2.0能精准复刻参考视频的运镜、动作节奏和特效，实现“指哪打哪”的精确控制。周鹏分析，创作者可以上传一个音频，让模型生成的人物按音频的声线说话，这样就不用像传统创作一样后期配音，大大减少了工作量。

Seedance 2.0模型架构本身也做出了创新。虽然其技术报告尚未公布，但从Seedance 1.0的技术报告来看，在传统的扩散模型基础上，该模型采用了“双分支扩散变换器架构”。传统模型生成视频和音频是分开的两件事：先生成画面，再贴声音，因此有嘴型对不上、脚步踩不准、背景音乐割裂等弊端。田丰介绍，在“双分支扩散变换器架构”下，视频与音频的联合生成，同步生长，比如飞驰汽车的轮胎特写应配有巨大的引擎轰鸣声、轮胎摩擦地面的声音，模型在理解这类画面时就会自动生成音频。人物口型匹配精度也可达毫秒级，而Veo在音画同步方面仍存在明显缺陷。

此外，Seedance 2.0还通过位置编码技术优化多镜头切换，解决人物突变问题，使得AI视频从单镜头摆拍，进化为拥有动画级分镜的作品。受访者的共识是，Seedance 2.0的出现，称得上是视频生成领域的“DeepSeek时刻”。新加坡南洋理工大学计算机学院助理教授刘子纬对《中国新闻周刊》称，无论是画质还是动态一致性Seedance 2.0都显著优于目前最强模型Veo，且首次突破了多镜头叙事生成，把AI视频推到了短视频或者说亚影视级的高度。

“抽卡”是一致性外的另一行业传统痛点。由于AI生成的视频画面具备随机性，用户需要多次使用同一提示词，才能得到相对满意的结果，俗称抽卡。同类模型单个镜头的抽卡次数可以达7次以上，从而带来可观的制作成本，以及冗长的制作周期。那么Seedance 2.0解决了抽卡问题吗？

在实测中，多位受访者发现，Seedance 2.0的单次生成可用率达90%以上，平均抽卡1—2次即可获得满意结果。周鹏指出，这是因为模型中加入了独特的AI代理（Agent），将创作者近乎白话的提示词进行再加工，用模型更能理解的语言作为输入，这样免去了创作者打磨提示词的过程，模型也不用再反复去猜创作者的意图。在创作中，Seedance 2.0也使用独特的“@素材名”模式，来让创作者指定素材的使用方法，从而让模型准确理解每个素材的用途。

不过，仍有创作者告诉《中国新闻周刊》，Seedance 2.0不能完全杜绝抽卡。《中国新闻周刊》在即梦平台使用单张图片和提示词生成了一段10秒钟的视频，单次尝试下确实得到了人物稳定、剧情符合描述的作品。不过在让人物“脱去外衣”这一AI非常难处理的精细指令下，Seedance 2.0的表现仍不完美。

目前在即梦平台，Seedance 2.0对注册用户免费开放。由于用户人数激增，虽然视频生成时间小于60秒，但《中国新闻周刊》生成上述视频的排队时间长达9小时。

该视频属于AI生成

《中国新闻周刊》在即梦平台使用单张图片和提示词生成的10秒钟的视频。

将彻底引爆AI短剧市场

周鹏将自己这类AI创作者形容为“怀春少女”，一面期待技术的更迭，一面又担忧技术更迭得太快了。

事实也许更偏向后者。一名海外博主发布了Seedance 2.0的效果视频，马斯克在2月12日转发了该帖，并评论称“这发生得也太快了”。周鹏用Seedance 2.0制作这类视频时，只需要“随便找几张图，花十分钟”，就能完成以前好几个小时的工作。在他看来，创作者脑子里的任何创意几乎都能被快速实现，一部短片电影的创作时长不会超过一个小时。

技术壁垒逐渐被抹平之外，制作成本也有了可观的降低。田丰表示，综合业界测评，传统短剧单集制作成本约5万元，5秒特效镜头成本约3000元。Seedance 2.0出现后，5秒特效镜头成本降至3元，5分钟视频成本压缩至千元级，这已经达到网剧、漫剧的自动化生产级别，将彻底引爆AI短剧市场，并最终重塑影视和特效行业。

“这是真正的创作平权，每个人都是导演。”周鹏感慨。不过，他也指出，这不一定是好事。目前，用户只需要保存短视频平台的爆款转场视频，利用Seedance 2.0将自己的人脸贴上去，就能轻松复制爆款转场。这不仅颠覆了AI创作逻辑，也颠覆了自媒体规则。周鹏认为，这可能带来网络安全隐患。

Seedance 2.0内测两天后，字节跳动紧急叫停了真人脸部素材的使用。官方使用手册指明，系统会自动拦截此类素材，上传后将无法生成视频内容。这一举措旨在保护内容安全与守护平台规范。不过，多位创作者表示，创作者本人的照片或视频在通过人脸识别后，仍可用于创作。

田丰指出，限制真实人脸上传是出于防范深度伪造的必要举措。如果Seedance 2.0可凭上传的单张照片、念几个字的声音采样，就能逼真复刻真人形象、声线及动作习惯，那么伪造诈骗视频的成本将变得极低。未来，建立AI创作的安全边界尤为重要，不仅要强制标注AI内容、限制敏感内容输入，还要加强内容审核机制。

大概半年前，周鹏还是名不见经传的独立AI创作者，如今已开始接手大型商单。“按每分钟视频来算，半年前我接商单的单价是一万元，现在最高的能做到7万元。”不过，他认为，这个价格保不住太久，因为工具的更新让创作者逐渐丢失价值，AI创作者将很快面临价值危机。

在AI创作时代，人类创作的价值究竟是什么？田丰指出，无限模仿不等于无限创造，人类创作的核心价值将从技术执行转向创意与情感表达。清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》称，视频制作技术壁垒的降低总体上对创作者是利好，可以用更低成本制作出更有价值的视频产品。相应地，制作细节的精细打磨以及背后哲理思考的表达，将变得更有价值。

“以后就是纯凭创意、纯讲故事的时代。”周鹏说，就像大语言模型消解了人类知识壁垒一样，AI视频模型将消解创作壁垒。一切还只是开端。

记者：周游

（nolan.y.zhou@gmail.com）

编辑：杜玮

运营编辑：肖冉

该图片可能由AI生成

书名：《AI商业进化论：“人工智能+”赋能新质生产力发展》

出版社：人民邮电出版社

作者：田丰

帮助你定位AI当下发展坐标的指南针

帮助你洞察AI未来演进趋势的航海图

通俗化解读AI的原理、特性和四大发展规律、提供AI赋能商业、引发新质生产力变革的一手案例分析。既有宏观视角的全局观照，又有各行业应用层面的下探记录，聚焦AI的原理与实践、现在与未来，是当下AI应用的全景图、更是身处AI技术浪潮之中的探路书。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.