那个“恐怖”的字节又回来了|算法|模态|大模型

那个“恐怖”的字节又回来了

2026-02-13 21:22:05　来源: 白鲸实验室one

北京举报

分享至

Seedance2.0就是Seedance2.0时刻，不是所谓的“DeepSeek时刻”。

轰动效应

这几年AI如贺岁片一般成为春节的顶流。2024年是Sora，2025年是DeepSeek R1，2026年轮到了字节的Seedance 2.0视频生成大模型。

当其他大厂还在红包大战中打得不可开交，字节向市场扔出的Seedance 2.0，凭借广泛的自发传播引发轰动效应。鉴于这几年AI拼命往春节挤，建议以后专门设立一个“贺岁档AI”，大概率比贺岁档电影好看。

作为国产视频生成模型的Seedance 2.0，这次又往前迈了一步。如果说去年推出的国产大模型DeepSeekR1只是接近世界顶尖模型，Seedance 2.0则真正完成了超越。

据字节官方称，Seedance 2.0采用稀疏架构来提升训练和推理效率，基于统一的多模态视频生成架构，模型涌现出了更强大的泛化能力，由此实现了较高质量的音画同步生成，还可支持组合的多模态参考、视频编辑、视频延长等功能。

引起讨论的关键在于，Seedance 2.0大幅降低了专业创作的门槛与成本。相比以往的视频生成模型，普通用户可一句话描述想要的画面，生成的视频动作自然、镜头连贯，不再是那种一眼假的AI视频了。

复杂场景Seedance 2.0也能处理，比如多人互动、多镜头转场，生成质量在目前的视频模型里属于第一梯队。官方介绍称，该模型非常适合创作从开篇到高潮的完整故事线，保证专业级的叙事流畅度。

在社交平台X上，甚至出现一些教海外用户注册并使用Seedance 2.0的教程贴。消息传递到国内，评论区中夹杂着中国AI用户的真实心声——真是风水轮流转。

也许不必再沉溺于过去的“DeepSeek时刻”，Seedance 2.0就是当下的Seedance 2.0时刻。无论是从模型性能还是从引起的轰动效应来看，它都值得定义属于自己的时刻。

字节旗下产品争相接入Seedance 2.0，试图接住这泼天的流量。2月12日，Seedance 2.0全面接入豆包和即梦产品，并上线火山方舟体验中心。

有网友晒出使用Seedance2.0制作的阿姆斯特丹（当今的纽约市）模拟器，与Google的Genie3世界模型进行对比，“与之前的模型不同，Seedance2.0真正准确地描绘了1670年的城市风貌”。

近几天我们在字节旗下产品小云雀、豆包、火山引擎内测试了几次Seedance 2.0，生成的视频效果确实很棒，尤其多镜头转换和人物真实感上，用“影视级”评价并非夸张。

但2月12日这天，我们继续用小云雀上的Seedance 2.0生成15秒的视频（会员可用），结果连续六次都生成失败，而豆包和火山引擎上的Seedance 2.0能正常使用。

Seedance 2.0自发布之初，就以“导演级”多镜头叙事和原生音画同步能力，被公认为是当前视频生成领域的突破性技术。

影视飓风创始人Tim体验完Seedance 2.0，用一段长达9分钟的视频（非广告）自发介绍，整个过程他都难掩震撼，多次连呼“恐怖”。“这不是一个小的技术革新，而是会推走行业所有过去流程和沉淀的一个海啸。” Tim在评测视频中如此评价。

杭州AI六小龙之一的游戏科学CEO冯骥，去年曾高度评价过DeepSeek R1，也奠定了他在AI圈的话语权。今年他称Seedance 2.0为“杀死比赛”的里程碑产品，并用“领先”“全能”这样的词语盛赞。

冯骥认为，Seedance 2.0可直接带来影视领域的产能爆炸。“一般性视频的制作成本将无法再沿用影视行业的传统逻辑，开始逐渐趋近算力的边际成本。内容领域必将迎来史无前例的通货膨胀，传统组织结构与制作流程会被彻底重构。相信只要用过的朋友，都能很快理解这个预测绝非杞人忧天。”冯骥说。

这个观点也隔空得到著名导演贾樟柯的认同，2月11日贾樟柯发微博说：“Seedance 2.0确实厉害，我准备用它做个短片。”美国导演查尔斯·柯伦用Seedance2.0制作了《光环》电影版的预告片，并表示，“这款AI视频软件将颠覆好莱坞。”

这意味着，Seedance2.0的视频生成能力已得到专业导演的认可，由AI带来的影视圈生产力变革也许就在眼前。

据字节跳动官方介绍，为全面评估模型在多模态场景的综合能力，团队协同影视领域专家，建立覆盖音视频生成、参考及编辑场景的综合评测集及相关评测标准。在各项评测中，Seedance 2.0的综合表现达到行业领先水平。

不过，字节跳动也坦言，模型在细节稳定性、多人口型匹配、多主体一致性、文字还原精度和复杂编辑效果等方面仍有优化空间。

Seedance 2.0还带动相关概念股上涨。2月11日，早盘Seedance概念继续活跃，掌阅科技、欢瑞世纪、博纳影业、德才股份3连板，荣信文化、捷成股份高开超10%。这显示出在Seedance 2.0带动下，市场对AI短剧和影视商业化落地能力的认可。

为什么是字节

自去年春节DeepSeek R1走红以来，Seedance 2.0是国内第二个真正凭借技术火出圈的大模型。字节紧赶慢赶，还是花费了一年的时间。

晚点曾报道，去年春节DeepSeek大火后字节面临着很大压力，模型一时间跟不上，产品那边开始自主行动，很多都选择接了DeepSeek。其中就包括即梦，提供了用DeepSeek优化提示词的服务。

字节豆包大模型视觉多模态生成方向负责人本是杨建朝，2025年7月，杨建朝宣布“暂时休息”并完成工作交接。2025年8月，豆包视觉基础模型研究负责人冯佳时也宣布离职，并于12月加盟腾讯任AGI研究中心多模态团队负责人。

此后，字节多模态交互和世界模型团队由2024年从阿里加入字节的周畅负责。周畅直接由吴永辉领导，并且他的管理范围持续扩大，其中就包括文生图Seedream、文生视频Seedance模型。这就意味着，Seedance 2.0正是由周畅领导的团队研发的。

今年1月，字节跳动CEO梁汝波在全员会上说，字节今年的关键词是 “勇攀高峰”，短期内高峰是 “豆包 /Dola（豆包海外版）助手应用”，重点是 “AI模型能力要做到行业前列，通过助手整合好已有业务”。

梁汝波或许也没想到，年会刚过不久Seedance2.0就率先攀上了高峰。毕竟2个月前，字节刚发布Seedance1.5pro。当时字节的官方介绍是，Seedance1.5Pro依托原生音视频联合架构与精细化后训练，较好地实现了对多模态指令的遵循。

两个月的时间里，Seedance视频生成模型有了明显的能力跃升，突破了单一镜头连贯性限制，可以实现多镜头连贯叙事。

这种能力演进也折射出字节在视觉模型团队结构上的变化，从以算法为核心的研究团队，转向以世界建模和工程体系为核心的综合团队。而去年下半年字节seed组织架构调整后，也呼应了这种变化。

杨建朝离职后，周畅负责视觉模型的同时，还接管了多模态交互与世界模型团队。这种架构调整，更利于打通视频生成从二维世界向真实的三维世界跃迁时的组织之间的沟通和交流。

在为什么是字节的问题上，除了组织架构和模型架构能力的优化，字节自有的短视频数据平台如抖音、TikTok，也具备天然优势。短视频平台拥有海量用户基础和视频数据，为模型训练提供丰富素材。

业内有个共识，模型训练算力只是敲门砖，数据才是核心基础。“短视频平台每天生产数亿条真实行为视频数据，尽管许多公开数据集能买到或者通过网络爬虫获得，但数据量和平台自带的规模不是一个量级。”一位算法工程师告诉我们。

除了数据规模和实时数据优势，短视频平台还天然拥有大量卡点剪辑样本、爆款节奏结构和高互动内容风格，也有助于帮助模型公司迅速获得评估模型能力的标准。

这也能解释国内TOP级视频生成模型，为何都集中在拥有短视频平台的公司，比如另一家是快手系的可灵。

在字节2月7号发布Seedance2.0前，可灵就于1月31号发布了可灵3.0，并于2月5日正式上线。可灵3.0同样可以实现文本、视频等多模态输入，在一致性、稳定性、分镜等方面均有突破。

但一位业内人士告诉我们，一般视频生成模型还是遵守客户协议的，并没有去训练用户上传平台的数据，基本都是通过公开数据集在训练。

震撼之外

Seedance2.0的出圈效应，也不可避免地面临当前AI公司商业化发展的困局——数据隐私与安全。

科技博主Tim在测试视频中惊呼Seedance2.0生成效果惊艳的同时，后面提出的问题令人担忧。他只是上传一张自己站在公司门口的照片，生成的AI视频直接调用了他的声音，当AI运镜里转向公司的对面时，画面与现实几乎一致。

Tim由此得出结论，Seedance2.0在未经授权的情况使用了他在云端的数据。

实际上对公开网络资料的使用，在AI行业内已经不是秘密。去年9月，《大西洋月刊》历时数月调查，写出一篇《人工智能将席卷YouTube创作者》的文章，文章指出，全球超1500万条YouTube视频被科技公司未经授权下载，成为AI视频生成模型的“原材料”。

这里的科技公司既包括微软、Meta、亚马逊、英伟达、Runway等国外巨头，也含带国内的大厂。

版权问题在国外引起过巨大争议。2025年以来，迪士尼相继对图片生成工具Midjourney，以及MiniMax旗下的影像生成工具海螺，还有谷歌等相继发出停止侵权函，指控他们训练模型时侵权。

去年10月，OpenAI的视频模型产品Sora2产生破圈效应后，引发包括美国电影协会、宫崎骏所在的吉卜力工作室等多家IP出版公司的抗议。

同样都是使用海量的公开网络资料训练，视频生成模型引发的争议远大于大语言模型。原因并不只是视频更具象，还因为大语言模型生成的文字更多被看作是提升效率，增强生产力，深度报道、专栏等仍然高度依赖人力。

而视频模型涉及摄影、剪辑、特效、表演、场景制作等完整流程，工业化程度高，随着视频生成模型的快速进化，以上整个流程的人力都可能被取代。这或许才是焦虑的来源。

当网络用户可以用AI工具，随意生成任意IP角色之间的互动视频时，冲击的就不只是制作成本，而是整个动画产业的商业逻辑，IP授权、发行窗口、内容控制权都会被重新定义。

版权问题尚可以通过分成方式解决，但当AI视频模型能力越来越强，不断突破真实世界的边界时，深度伪造与信息安全风险以及会将真实世界引向什么处境，也同样充满未知。

撰写｜吴寻

编辑｜柳嘉

「白鲸实验室」原创文章

转载、交流、合作请添加微信：liujiaquan2025

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

那个“恐怖”的字节又回来了

“马斯克不懂AI”：OpenAI当庭戳老底

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

中国发布阻断禁令后鲁比奥声称将二次制裁 外交部回应

活塞1比0骑士：坎宁安不再是一个人了

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

估值450亿美元 大基金被曝将投资DeepSeek

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

开车的小孩子最帅了

遥遥领先！这个澄迈顶流红盘，凭什么持续霸榜

用青花瓷的方式，打开西溪湿地

“iPhone Ultra”或将成为业内最易维修的折叠屏手机

震撼！三星中国总部大楼高260米，雄踞北京CBD！

中国发布阻断禁令后鲁比奥声称将二次制裁外交部回应

中国发布阻断禁令后鲁比奥声称将二次制裁外交部回应

谢娜演唱会暗藏惊喜何炅瞒天过海现身

估值450亿美元大基金被曝将投资DeepSeek

领克10/领克10+ 无论能源形式领克都要快乐