网易首页 > 网易号 > 正文 申请入驻

多模态“Deepseek时刻”下的大厂分化:字节拼“效率”,快手攻“专业”,阿里聚焦“电商”!

0
分享至

年初这一波多模态更新来得很密:1月31日快手把可灵(Kling)推到3.0,2月7日字节发布Seedance 2.0,2月10日字节的Seedream 5.0和阿里的Qwen-Image-2.0又把“文生图/图像编辑”底座补了一刀。

华创证券研究所的姚蕾12日在报告里的判断很直接——视频生成不再只是炫技,而是在往能进工作流的工具演化:“AI视频生成正在从盲盒式娱乐向精准工业化生产跨越。”商业化迟迟起不来的症结,归到“抽卡”导致的边际成本不可控:同样的需求要反复生成、反复返工,废片率吞掉时间和预算。


这次可灵3.0和Seedance 2.0的升级重点,不是单纯拼画质,而是把可控性抬到优先级更高的位置:跨镜头主体一致性、复杂指令的语义遵循、以及“生成后还能改”的编辑能力,合在一起去压低废片率。研报的结论是:技术跨越让AI视频具备进入规模化B端工作流的基础,电商广告、短剧/漫剧制作会更早感受到冲击。

往下推,报告把影响拆成两层:一层是产品路线分化——字节更像在做“效率基建”,快手更偏“专业叙事”;另一层是供给侧革命重算成本结构——内容生产的边际成本越来越像算力成本。对应到投资线索,研报把受益方向落到内容IP、内容版权、AI视频工具/模型,以及云与平台的推理侧需求上。

真正被解决的,是“抽卡”带来的不可控成本

报告反复强调一个逻辑链:过去AI视频难以商用,不是“做不出来”,而是“做出来太不稳”。同样的脚本、同样的素材和提示词,成片质量波动大,逼着创作者用更多轮生成去赌结果,边际成本就失控了。

报告认为新一代模型的意义在于把“生成能力”往后放了一位,把“可控性”放到前台:通过原生多模态架构、指令对齐,以及对主体一致性/语义遵循的强化,把废片率压下去,整体视频生产成本才会跟着掉下来。商业化的门槛因此被重新划线——从“能不能做”变成“能不能稳定交付”。

可灵3.0押注“大片感”:物理拟真与长逻辑叙事更优先

研报把可灵3.0的关键词归为两件事:基础能力的系统升级,以及生成与编辑的一体化(Omni)。

在视频侧,可灵3.0的升级点主要落在:多镜头/连续动作场景下的主体一致性更强;复杂文本指令解析更细;多人同框时的指代混乱被缓解,并强调了“文本与视觉角色精准映射”(包括多语种、方言口音演绎与口型神态自然)。

Omni模式是另一个被重点拿出来讲的变化:在已生成内容基础上做局部可控修改,减少“推倒重来”。报告还提到两项更偏专业创作的能力:一是可创建视频主体(提取角色特征与原声音色,做精准口型匹配与驱动);二是原生自定义分镜能力,并把单次生成时长提升至15秒,允许在镜头级别指定时长、景别、视角、叙事内容和运镜方式。


图片侧,可灵图片3.0也被当作“工作流补全”的一环:最多支持10张参考图以锁定主体轮廓、核心元素与色调基调;多参考图可自由指定元素并做增删改;支持批量组图输出,用于故事板/素材包制作;同时强化高清输出与细节表现。


Seedance 2.0把视频做成“可编排”的工业工具

报告对Seedance 2.0的定位更像“工业化标准”:基础层面更强调物理规律合理、动作自然、指令理解精准、风格保持稳定;并突出三类能力——一致性优化(从人脸到服装、字体细节、场景跳变等);高难度运镜与动作的可控复刻;创意模板/复杂特效的精准复刻。


更关键的是交互范式。研报认为Seedance 2.0用“@素材名”指定图片/视频/音频用途,实质是在把黑盒式生成拆解成可控的生产流程:模型可以分别提取@视频的运镜、@图片的细节、@音频的节奏,从而显著降低“废片率”。

报告给出的使用与限制也更贴近“生产约束”:支持图片输入≤9张;视频输入≤3个且总时长不超过15秒;音频支持MP3上传≤3个且总时长不超过15秒;混合输入总上限12个文件;生成时长≤15秒(可选4-15秒);并提供自带音效/配乐输出。入口上,“首尾帧”和“全能参考”对应不同的素材组织方式。

字节走“效率基建”,快手走“专业叙事”,阿里更偏电商垂直

研报对竞争格局的判断不太看“跑分排名”,更在意厂商战略分野。

报告把字节的路线概括为低门槛、低成本的工具化、泛化能力,类似“剪映”的高级形态,目标是降低全网内容生产成本并反哺生态;快手可灵则押注物理模拟、复杂场景真实感与角色一致性,更适合影视Demo、电影剧情等对连贯性要求高的专业内容;阿里千问在图像模型高保真更新的方向上更偏垂直场景(电商),强化商品数字化相关能力。

这三条路指向的不是同一种商业模式:一条追求规模化吞吐,一条追求高质量叙事交付,一条追求垂直行业的“可用即生产”。

内容供给侧革命:边际成本向算力成本收敛,IP反而更稀缺

商业化推演里,报告把“供给侧革命”讲得很激进:图像与视频基座能力双重提升后,内容生产的边际成本会越来越趋向算力成本。

短期它更看好两类变化:营销/电商服务商的素材产出效率提高,带来毛利改善;漫剧、短剧行业可能出现产能爆发。中长期则把矛盾推向IP端——当内容更容易被生产,稀缺性的定价会更集中到IP上:头部IP及衍生品价值更高,腰部IP也可能通过AI视频化实现价值重估。与此同时,拥有强算力基础设施(云)和闭环流量场景(平台)的巨头,会更直接吃到推理侧频繁调用带来的红利。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
对印反击战5年后中印再次交火,我军伤亡百余人,印军伤亡多少?

对印反击战5年后中印再次交火,我军伤亡百余人,印军伤亡多少?

明月清风阁
2026-02-11 07:00:17
出大事了,被俘乌克兰特工终于开口,两大秘密曝光,普京不再手软

出大事了,被俘乌克兰特工终于开口,两大秘密曝光,普京不再手软

起喜电影
2026-02-11 12:51:45
1955年授衔,毛主席嫌上将太多,贺龙大笔一挥划掉一人:这人我熟,让他下来

1955年授衔,毛主席嫌上将太多,贺龙大笔一挥划掉一人:这人我熟,让他下来

历史回忆室
2026-02-10 23:48:14
离岸人民币兑美元创2023年5月4日以来新高

离岸人民币兑美元创2023年5月4日以来新高

财联社
2026-02-12 09:42:06
长江和记:邀请巴拿马共和国进行磋商,就巴拿马港口问题积极寻求解决方案

长江和记:邀请巴拿马共和国进行磋商,就巴拿马港口问题积极寻求解决方案

界面新闻
2026-02-12 18:41:33
公公丈夫两天内相继离世!大姑仍在ICU,网友:大概率是基因遗传

公公丈夫两天内相继离世!大姑仍在ICU,网友:大概率是基因遗传

火山詩话
2026-02-12 13:17:11
春节期间将向消费者发放20.5亿元

春节期间将向消费者发放20.5亿元

每日经济新闻
2026-02-11 13:49:48
体育总局宣布周继红免职退休,曾引发内斗争议,如今能否平稳落地

体育总局宣布周继红免职退休,曾引发内斗争议,如今能否平稳落地

历史龙元阁
2025-11-23 15:15:03
成都首次连续25天不限行,为什么“敢”?需求在,算过账,管得细

成都首次连续25天不限行,为什么“敢”?需求在,算过账,管得细

红星新闻
2026-02-12 12:15:26
罗永浩怼段永平“懂个屁”,这个全是“破烂”的时代

罗永浩怼段永平“懂个屁”,这个全是“破烂”的时代

不正确
2026-02-11 22:53:03
美媒想不明白:明明“遏华”这么努力,为何都是自己人失败?

美媒想不明白:明明“遏华”这么努力,为何都是自己人失败?

通文知史
2026-02-11 20:55:04
骤降13℃!10级大风!除夕前,河南还有一波雨雪

骤降13℃!10级大风!除夕前,河南还有一波雨雪

大象新闻
2026-02-12 08:21:04
孤独的婚车获全网祝福,新郎服务区发糖显格局,两人正面照曝光

孤独的婚车获全网祝福,新郎服务区发糖显格局,两人正面照曝光

林轻吟
2026-02-12 14:27:31
古代没有光谱仪,给一块石头包上银子,能拿出去当钱花吗?

古代没有光谱仪,给一块石头包上银子,能拿出去当钱花吗?

收藏大视界
2026-01-17 17:41:56
全球公认的真人版春丽:木村萌那,使用百裂脚KO全场

全球公认的真人版春丽:木村萌那,使用百裂脚KO全场

街机时代
2026-02-11 19:26:15
粟裕平时指挥不动人,为何淮海战役全老实了?原因太现实!

粟裕平时指挥不动人,为何淮海战役全老实了?原因太现实!

顾史
2026-02-12 12:42:27
关门14年,广州知名百年老字号重开!街坊激动哭了:必须支持

关门14年,广州知名百年老字号重开!街坊激动哭了:必须支持

羊城攻略
2026-02-12 04:39:35
捡漏买到二手物品远比新的还要香!网友:‬这比电视剧拍的都要牛

捡漏买到二手物品远比新的还要香!网友:‬这比电视剧拍的都要牛

另子维爱读史
2026-02-11 18:29:27
智谱GLM-5被质疑蒸馏美国大模型,自我介绍自称“Claude”,网友:真不要脸

智谱GLM-5被质疑蒸馏美国大模型,自我介绍自称“Claude”,网友:真不要脸

知识圈
2026-02-12 10:09:38
中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

阿器谈史
2026-01-30 08:40:58
2026-02-12 21:51:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
141694文章数 2652522关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

乘客在高铁商务舱买到"低人一等座" 12306:该位置特殊

头条要闻

乘客在高铁商务舱买到"低人一等座" 12306:该位置特殊

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

手机
教育
旅游
数码
时尚

手机要闻

机构:1月中国智能手机销量同比下滑23%

教育要闻

“老鼠进你家都得开导航”,家长晒学霸孩子,卫生却差到难以忍受

旅游要闻

魔都看展丨一秒穿越至新疆,聆听丝路回响

数码要闻

华为WATCH GT 6系列手表获鸿蒙HarmonyOS 6.0.0.188升级

“时髦小姨风”太适合过年了,谁穿谁好看!

无障碍浏览 进入关怀版