该图片可能由AI生成![]()
图:黑客帝国版“田丰说”(Seedance2.0生成)
田丰锐评
马年春节前夕,字节发布了视频生成大模型Seedance2.0,热度很高,快思慢想研究院院长、特邀评论员田丰接受《中国新闻周刊》记者采访,精彩观点如下:
《中国新闻周刊》记者提问1:和同类模型如谷歌Veo、可灵3.0等比较,Seedance2.0是否在能力方面断层领先?其最主要的优势是什么?
田丰:
经过快思慢想研究院上手亲测,Seedance2.0产出的视频效果确实是“遥遥领先”,核心竞争优势在于"导演级"的可控性,因此Seedance2.0被《黑神话:悟空》制作人冯骥评价为"当前地表最强视频生成模型,没有之一"。与竞品相比,显著优势体现在:
1)多模态参考技术:Seedance2.0支持文本、图像、视频、音频四种模态输入(最多12路参考素材),而竞品A仅支持首尾帧,竞品B仅支持文生视频和图生视频。在实测中,Seedance2.0能精准复刻参考视频的运镜、动作节奏和特效,实现"指哪打哪"的精确控制。
2)音画精准同步:采用双分支扩散变换器架构(Dual-branch Diffusion Transformer),实现视频与音频的联合生成,口型匹配精度达毫秒级,支持8种方言对口型,而谷歌Veo在音画同步方面仍存在明显滞后,这将增加视频加工成本与时间。
3)镜头连贯性:通过ROPE位置编码技术优化多镜头切换,解决"角色突变"问题,实测可用率超90%。相比之下,竞品A在人物一致性上仍有明显缺陷,竞品B在人物换装问题上表现欠佳。
4)视频生成效率:Seedance2.0生成2K高清视频的速度比同类竞品快约30%,可在60秒内生成带有原生音频的多镜头序列视频,且可以并行生成多个视频,而竞品生成单视频通常需要数分钟。
中美AI视频技术差距已达2代,Seedance2.0不仅在技术层面领先,更在工业化落地能力上实现了"弯道超车"。
该图片可能由AI生成![]()
图:Seedance2.0 网友作品
《中国新闻周刊》记者提问2:Seedance2.0如何做到技术领先?是其模型训练方式有别,还是模型本身有所突破?
田丰:
快思慢想研究院认为,Seedance2.0的技术领先源于其底层架构的革命性突破,而非简单的参数优化,核心突破在于三个关键创新点:
1)双分支扩散变换器架构(Dual-branch Diffusion Transformer)
传统模型采用"先生成画面、后匹配音频"的模式,导致音画脱节,更无法根据视频与虚拟摄像机的相对位置调整音量大小。Seedance2.0将视觉生成与音频生成分为两个独立分支,同时进行训练与融合,实现音画的原生协同,比如飞驰汽车的轮胎特写应有巨大的引擎轰鸣声、轮胎摩擦地面的声音,虚拟摄像机离远时声音逐步变小。这一架构使模型能同时处理视觉细节与音频节奏,避免了"先生成视频、再匹配音频"的滞后性。
2)原生多模态对齐
Seedance2.0在训练阶段就将视觉、听觉、文本等多模态信号深度融合,让模型理解不同模态之间的关联逻辑,实现"确定性生成"。传统AI视频模型的随机性,源于视觉与听觉信号的分离训练,导致画面逻辑断裂、音画脱节。Seedance2.0在训练阶段就将视觉、听觉、文本等多模态信号深度融合,让模型能够理解不同模态之间的关联的逻辑关系,从而实现“确定性生成”——只要输入明确,就能稳定输出符合预期的内容。
3)ROPE位置编码技术
针对多镜头切换时"跳戏"的痛点(竞品大多存在该问题),Seedance2.0引入ROPE位置编码技术,优化了镜头之间的衔接逻辑,让模型能够记住不同镜头中的角色特征、场景细节。该技术相当于给模型植入了"记忆功能",避免了镜头切换时出现角色外貌、场景氛围的突变,而突变(比如道具变形或消失)往往带来令人厌恶的“不真实感”。
以上这些技术突破使Seedance2.0从"玩具级工具"升级为"工业级生产装备",实现了从"生成画面"到"导演思维"的跨越,我们已经在Seedance2.0上重现了田老师数字人分身的《黑客帝国》、《恶灵骑士》同款运镜。
该视频可能由AI生成
视频:恶灵骑士版“田丰说”(Seedance2.0生成)
《中国新闻周刊》记者提问3:Seedance是否真的解决了“抽卡”问题?
田丰:
是的,Seedance2.0大幅减少了"抽卡"频率,解决了行业顽疾。"抽卡"是AI视频生成行业的传统痛点,由于AI生成的视频画面具备随机性,用户需要同一提示词使用多次,才能得到相对满意的一版结果,往往是十里挑一,业内俗称"抽卡",单个镜头的抽卡次数可以高达7次以上。“抽卡次数”即视频成本(Tokens费用),因此可做如下推理测算:
1)Seedance 2.0模型更高的可控性有助于减少抽卡成本,从而降低漫剧行业的制作成本和制作周期。
2)如果Seedance 2.0可以使抽卡频率降低至原本的50%,则可以令模型每秒生成成本相比同业降低37%。
3)行业平均需7次生成才能获得可用视频,Seedance 2.0将单次生成可用率提升至90%以上,降本幅度达37%-68%。
在我们实测中,Seedance2.0的可用率已超过90%,而行业平均水平仅为20%左右。这意味着创作者平均只需生成1-2次即可获得满意结果,大幅降低了创作成本和时间,对普通用户来说堪称“惊艳”。
该图片可能由AI生成![]()
图:Seedance2.0 网友作品
《中国新闻周刊》记者提问4:Seedance的技术水平是否会很快被超越?如何避免这一应用如流星般消逝?
田丰:
Seedance2.0的技术优势短期内难以被国内外竞争对手超越,而持续创新是保持领先的关键法则。
1)大规模采购芯片:Seedance2.0的领先优势主要源于字节跳动的"算力基建"。2026年,字节跳动计划在AI基础设施领域的资本支出约为1600亿元人民币。这一规模在国内十分领先,相当于腾讯同年相关投入的2倍,也高于阿里巴巴的年均投入水平。该预算中约一半(850亿元)将专项用于采购AI芯片。采用"饱和式攻击"策略使字节跳动能够以资源密度形成竞争壁垒。当其他公司仍聚焦于算法优化时,字节跳动已借助算力规模攻克了诸多技术瓶颈。
2)自研芯片:与Google、马斯克xAI类似,字节跳动正在推进自研AI芯片布局,代号"SeedChip"的自研AI芯片项目,2026年度目标产量为10万颗,若成功量产,单卡成本有望下降30%至50%,进一步巩固成本优势。
为避免"流星般消逝"昙花一现,字节跳动正采取以下策略:
(1)持续投入算力建设,2026年AI基础设施投入1600亿元。
(2)推进自研芯片(SeedChip)布局。
(3)优化多模态融合与用户体验。
(4)深度整合字节系生态,如将Seedance2.0融入即梦、小云雀等,导入大量存量用户群体。
因此,中国领跑的关键在于以多模态工业化落地能力实现“弯道超车",字节正在跻身于全球顶尖的“AI应用超级工厂”。
该图片可能由AI生成![]()
图:Seedance2.0 网友作品
《中国新闻周刊》记者提问5:有分析称,在Seedance加持下5秒特效镜头的制作成本已从3000元降至3元,您是否有观察到类似的数据?其究竟会带来多少成本缩减?
田丰:
是的,这一数据有据可查,且成本缩减幅度远超预期。正如业界测试者所说,5秒特效镜头成本从3000元降至3元,5分钟视频成本压缩至千元级,产能提升超千倍。传统特效镜头月均成本约3000元,而Seedance 2.0生成2分钟视频仅需3元;90分钟影片制作成本从万元级降至2000元级。咱们来拆解具体成本缩减:
1)传统短剧单集制作成本约5万元,5秒特效镜头成本高达3000元。Seedance2.0下,5秒特效镜头成本降至3元,5分钟视频成本压缩至1000元左右,这已经达到网剧、漫剧的自动化生产“甜点”,将彻底引爆“AI短剧”大爆发。
2)产能提升超千倍:传统制作周期为数月,Seedance2.0可将单部制作周期压缩至20天。若抽卡频率降低至原本的50%,模型每秒生成成本相比同业降低37%。若抽卡频率降低至原本的75%,则可降低总生成成本约5%。因此,Seedance2.0不仅降低了单个镜头的成本,更大幅提升了整体产能,为视频内容创作带来了革命性变化。
该图片可能由AI生成![]()
图:Seedance2.0 网友作品
《中国新闻周刊》记者提问6:目前即梦官方限制了真实人脸的上传,您认为出于什么考虑?AI创作会有怎样的风险,是否应该有更清晰的边界?
田丰:
限制真实人脸上传是出于防范深度伪造风险的必要举措,AI视频创作确实存在重大安全隐患,需要建立清晰的边界。Seedance2.0模型可凭上传的单张照片、念几个数字的声音采样,就能逼真复刻真人形象、声线及动作习惯,不仅五官一模一样,而且精细到胡子茬、青春痘瘢痕等微小细节,如果被黑客利用伪造诈骗视频,将对不懂技术的百姓产生财产损失。目前,字节已紧急暂停真人素材参考功能,并强制标注AI生成内容。
AI视频创作的主要风险包括:
1)深度伪造风险:可精准复刻真人形象、声线及动作习惯,用于诈骗、诽谤等非法活动。
2)版权与合规风险:训练数据涉及海量公开素材,比如明星视频、千万粉丝网红视频等,存在版权纠纷隐患。
3)社会伦理风险:可能导致虚假信息泛滥,影响社会稳定。
为防范这些风险,快思慢想研究院强烈建议建立以下安全边界:
1)强制AI内容标注:所有AI生成内容必须明确标注"AI生成",甚至对老人小孩、残障人士等辨识力不高群体采用“AI生成”示警声音。
2)限制敏感内容输入:如真人面部、特定名人形象等,本人授权同意AI生成除外,即形成AI名人分身二创的“白名单”与“黑名单”,即使同意也应建立起“停止底线”,比如生成色情、恐怖等引人不适的视频。
3)建立内容审核机制:对高风险内容进行人工审核,同时训练AI审核师持续提升其审核辨识能力,以避免过长审核时间对百姓学习AI技能的热情,与海量作品爆发挑战。
4)制定行业标准:推动AI生成视频内容的规范化、标准化。
正如字节跳动已采取的措施,"紧急暂停真人素材参考功能,并强制标注AI生成内容",这是负责任的技术发展路径,“可信AI”来自“可控AI”。
该图片可能由AI生成![]()
图:Seedance2.0 网友作品
《中国新闻周刊》记者提问7:未来随着AI创作门槛降到极低,所有人都能成为导演,那么人类创作的核心价值是什么?
田丰:
1)AI能“无限模仿”不等于能“无限创造”:比如新光影风格、新运镜、新服化道、新武术动作、新人物微表情等等,科技平权带来人人皆是“电影制片厂”,但产出的是电影工业艺术品,还是电影工业垃圾,大众观看后高下立见。
2)AI将从"技术密集型"转向"创意密集型":人类创作的核心价值将从技术执行转向创意与情感表达。《黑神话:悟空》制作人冯骥认为:“未来传统团队或成非遗手工作坊。"简言之,人类创作的核心价值将体现在“创意策划”,AI能执行技术层面、给人类带来各种奇思妙想的“线索”,但核心创意构思仍需人类主导。另外,情感表达方面,AI难以理解并表达复杂情感,人类创作者能带来更具层次感的丰富情绪,与更深的情感共鸣。
3)文化理解的人机对齐:AI对东西方数千年历史文化背景的理解有限,甚至有误,AI偏见由此产生,比如何为美是多种多样的,并没有标准答案。人类能更准确地传递文化内涵、审美眼光。人类也能帮助AI做出伦理判断纠错,AI缺乏道德判断能力,人类需在创作中融入世界多元化伦理考量,一方水土养育一种社会伦理与民族美学。当AI学会了“文史哲记忆”和“世界逻辑”,视频生成才算真正走出了“抽盲盒”的原始阶段。
AI将解放创作者,使其从技术执行中解放出来,专注于更高层次的伟大创意与内心表达。 未来,AI将成为"导演助手",而人类创作者将从"技术执行者"升级为"创意策展人"、“艺术思想家”,内容创作的核心价值将从技术实现转向创意表达与情感共鸣。
Seedance2.0的问世,标志着AI视频创作进入"导演级"新时代,中国在AI视频领域的技术实力已实现全球领跑。这一技术突破不仅将大幅降低视频创作成本、缩短制作周期,更将重塑整个内容创作产业的格局。随着AI技术的持续演进,我们期待看到更多伟大的东方AI创新应用,但同时也需审慎应对技术带来的新型伦理与社会挑战。正如《黑神话:悟空》制作人冯骥所言,AI不是取代人类创作者,而是赋能人类,让我们能够更专注于创意的表达与情感的传递。
该图片可能由AI生成![]()
新闻正文
《中国新闻周刊》:是时候“颠覆好莱坞”了?
新闻网址:
https://mp.weixin.qq.com/s/61u8g-y7HczuiIINEoBFKw
![]()
一句话打造一个视频的时代
或许真的到来了
一张男人奔跑的图片,距离一个有运镜、背景音,和实物碰撞的电影级逃亡片段有多远?
该视频可能由AI生成
Seedance 2.0官方生成的电影级逃亡片段
2月12日,字节跳动正式上线新一代AI视频生成模型Seedance 2.0,并接入旗下生成式AI创作平台“即梦”以及豆包App。几天前,Seedance 2.0开启内测,其前序模型为诞生于去年6月的Seedance 1.0。于是,实现上述变换只需这样一句表述:“镜头跟随黑衣男子快速逃亡,后面一群人在追,镜头转为侧面跟拍,人物惊慌撞倒路边的水果摊爬起来继续逃,人群慌乱的声音。”
内测开启的几天里,抖音等众多国内外社交媒体和短视频平台被Seedance 2.0生成的视频“攻占”,许多海外创作者在X平台上发帖,寻求以+86开头的手机号,用以体验Seedance 2.0。在官方使用手册上,Seedance 2.0自称为“杀死比赛(kill the game)”的一代模型。
2月12日,埃隆·马斯克在社交平台上点评,“这发生得也太快了(It's happening fast)”。贾樟柯也在个人微博账号发文称:“Seedance 2.0确实厉害,我准备用它做个短片。”有美国导演称,“这没准会颠覆好莱坞”。多位受访者向《中国新闻周刊》指出,AI视频生成领域竞争激烈。美国谷歌的Veo 3.1模型此前领跑全球,OpenAI的Sora 2以及快手于2月5日上线的可灵3.0模型都各有千秋。然而,Seedance 2.0或许已颠覆这一格局,它在角色一致性、物理真实性等方面“一骑绝尘”。
一句话打造一个视频的时代,或许真的到来了。
不再“抽卡”?
2月10日,周鹏的父亲在抖音平台上发布了一个由Seedance 2.0制作的视频,内容是打斗场面,短短几天内便获得超过百万播放量,以及4000多赞。
“没有人指导,我爸自己靠一个视频‘起号’了。这样的例子还不少。”周鹏现在是全职AI视频创作者,也是最早一批体验Seedance 2.0的用户。他告诉《中国新闻周刊》,Seedance 2.0在AI和自媒体创作圈内爆火,源于其模型能力的大幅跃升。
最显著的便是物理一致性。Seedance 2.0单次输出视频时长不超过15秒,周鹏说,要让视频中的主要人物在所有切换视角的镜头里都保持形象一致,且维持15秒,非常不容易。以往的AI视频,往往存在人物面容衣着变化、表情与情绪不符、身体重心错误、与环境互动不自然等痕迹。除人物外,复杂物品零部件例如车辆后视镜等,也常在不同镜头中出现又消失,很难保持一致。
而Seedance 2.0在这方面的表现令人惊讶。“它能最大程度符合真实物理规律。”周鹏表示,打斗场景涉及许多物理规律,模型“翻车率”很高,但在近乎白话的提示词和参考视频的条件下,Seedance 2.0生成的招式动作细致,人物的走位合理,受击反馈也很真实。也就是说,AI视频真正开始“以假乱真”了。
要做到这一点,首先需要多模态输入。Seedance 2.0 目前支持图像、视频、音频、文本四种模态输入,最多支持12条上传素材。快思慢想研究院院长田丰告诉《中国新闻周刊》,在实测中,Seedance 2.0能精准复刻参考视频的运镜、动作节奏和特效,实现“指哪打哪”的精确控制。周鹏分析,创作者可以上传一个音频,让模型生成的人物按音频的声线说话,这样就不用像传统创作一样后期配音,大大减少了工作量。
Seedance 2.0模型架构本身也做出了创新。虽然其技术报告尚未公布,但从Seedance 1.0的技术报告来看,在传统的扩散模型基础上,该模型采用了“双分支扩散变换器架构”。传统模型生成视频和音频是分开的两件事:先生成画面,再贴声音,因此有嘴型对不上、脚步踩不准、背景音乐割裂等弊端。田丰介绍,在“双分支扩散变换器架构”下,视频与音频的联合生成,同步生长,比如飞驰汽车的轮胎特写应配有巨大的引擎轰鸣声、轮胎摩擦地面的声音,模型在理解这类画面时就会自动生成音频。人物口型匹配精度也可达毫秒级,而Veo在音画同步方面仍存在明显缺陷。
此外,Seedance 2.0还通过位置编码技术优化多镜头切换,解决人物突变问题,使得AI视频从单镜头摆拍,进化为拥有动画级分镜的作品。受访者的共识是,Seedance 2.0的出现,称得上是视频生成领域的“DeepSeek时刻”。新加坡南洋理工大学计算机学院助理教授刘子纬对《中国新闻周刊》称,无论是画质还是动态一致性Seedance 2.0都显著优于目前最强模型Veo,且首次突破了多镜头叙事生成,把AI视频推到了短视频或者说亚影视级的高度。
“抽卡”是一致性外的另一行业传统痛点。由于AI生成的视频画面具备随机性,用户需要多次使用同一提示词,才能得到相对满意的结果,俗称抽卡。同类模型单个镜头的抽卡次数可以达7次以上,从而带来可观的制作成本,以及冗长的制作周期。那么Seedance 2.0解决了抽卡问题吗?
在实测中,多位受访者发现,Seedance 2.0的单次生成可用率达90%以上,平均抽卡1—2次即可获得满意结果。周鹏指出,这是因为模型中加入了独特的AI代理(Agent),将创作者近乎白话的提示词进行再加工,用模型更能理解的语言作为输入,这样免去了创作者打磨提示词的过程,模型也不用再反复去猜创作者的意图。在创作中,Seedance 2.0也使用独特的“@素材名”模式,来让创作者指定素材的使用方法,从而让模型准确理解每个素材的用途。
不过,仍有创作者告诉《中国新闻周刊》,Seedance 2.0不能完全杜绝抽卡。《中国新闻周刊》在即梦平台使用单张图片和提示词生成了一段10秒钟的视频,单次尝试下确实得到了人物稳定、剧情符合描述的作品。不过在让人物“脱去外衣”这一AI非常难处理的精细指令下,Seedance 2.0的表现仍不完美。
目前在即梦平台,Seedance 2.0对注册用户免费开放。由于用户人数激增,虽然视频生成时间小于60秒,但《中国新闻周刊》生成上述视频的排队时间长达9小时。
该视频属于AI生成
《中国新闻周刊》在即梦平台使用单张图片和提示词生成的10秒钟的视频。
将彻底引爆AI短剧市场
周鹏将自己这类AI创作者形容为“怀春少女”,一面期待技术的更迭,一面又担忧技术更迭得太快了。
事实也许更偏向后者。一名海外博主发布了Seedance 2.0的效果视频,马斯克在2月12日转发了该帖,并评论称“这发生得也太快了”。周鹏用Seedance 2.0制作这类视频时,只需要“随便找几张图,花十分钟”,就能完成以前好几个小时的工作。在他看来,创作者脑子里的任何创意几乎都能被快速实现,一部短片电影的创作时长不会超过一个小时。
技术壁垒逐渐被抹平之外,制作成本也有了可观的降低。田丰表示,综合业界测评,传统短剧单集制作成本约5万元,5秒特效镜头成本约3000元。Seedance 2.0出现后,5秒特效镜头成本降至3元,5分钟视频成本压缩至千元级,这已经达到网剧、漫剧的自动化生产级别,将彻底引爆AI短剧市场,并最终重塑影视和特效行业。
“这是真正的创作平权,每个人都是导演。”周鹏感慨。不过,他也指出,这不一定是好事。目前,用户只需要保存短视频平台的爆款转场视频,利用Seedance 2.0将自己的人脸贴上去,就能轻松复制爆款转场。这不仅颠覆了AI创作逻辑,也颠覆了自媒体规则。周鹏认为,这可能带来网络安全隐患。
Seedance 2.0内测两天后,字节跳动紧急叫停了真人脸部素材的使用。官方使用手册指明,系统会自动拦截此类素材,上传后将无法生成视频内容。这一举措旨在保护内容安全与守护平台规范。不过,多位创作者表示,创作者本人的照片或视频在通过人脸识别后,仍可用于创作。
田丰指出,限制真实人脸上传是出于防范深度伪造的必要举措。如果Seedance 2.0可凭上传的单张照片、念几个字的声音采样,就能逼真复刻真人形象、声线及动作习惯,那么伪造诈骗视频的成本将变得极低。未来,建立AI创作的安全边界尤为重要,不仅要强制标注AI内容、限制敏感内容输入,还要加强内容审核机制。
大概半年前,周鹏还是名不见经传的独立AI创作者,如今已开始接手大型商单。“按每分钟视频来算,半年前我接商单的单价是一万元,现在最高的能做到7万元。”不过,他认为,这个价格保不住太久,因为工具的更新让创作者逐渐丢失价值,AI创作者将很快面临价值危机。
在AI创作时代,人类创作的价值究竟是什么?田丰指出,无限模仿不等于无限创造,人类创作的核心价值将从技术执行转向创意与情感表达。清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》称,视频制作技术壁垒的降低总体上对创作者是利好,可以用更低成本制作出更有价值的视频产品。相应地,制作细节的精细打磨以及背后哲理思考的表达,将变得更有价值。
“以后就是纯凭创意、纯讲故事的时代。”周鹏说,就像大语言模型消解了人类知识壁垒一样,AI视频模型将消解创作壁垒。一切还只是开端。
记者:周游
(nolan.y.zhou@gmail.com)
编辑:杜玮
运营编辑:肖冉
该图片可能由AI生成![]()
书名:《AI商业进化论:“人工智能+”赋能新质生产力发展》
出版社:人民邮电出版社
作者:田丰
帮助你定位AI当下发展坐标的指南针
帮助你洞察AI未来演进趋势的航海图
通俗化解读AI的原理、特性和四大发展规律、提供AI赋能商业、引发新质生产力变革的一手案例分析。既有宏观视角的全局观照,又有各行业应用层面的下探记录,聚焦AI的原理与实践、现在与未来,是当下AI应用的全景图、更是身处AI技术浪潮之中的探路书。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.