网易首页 > 网易号 > 正文 申请入驻

赛道Hyper | 阿里开源通义万相Wan2.2:突破与局限

0
分享至

作者:周源/华尔街见闻

7月28日,阿里巴巴开源电影级视频生成模型通义万相Wan2.2,模型单次可生成5秒的高清视频。

Wan2.2此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型。

其中,文生视频模型和图生视频模型均为业界首次使用MoE架构(混合专家模型:Mixture of Experts),总参数量为27B,激活参数量高达14B,均由高噪声专家模型和低噪专家模型组成,分别负责视频的整体布局和细节完善,在同参数规模下,可节省约50%的计算资源消耗。

这是阿里在AI视频生成领域投下的一枚重要棋子。作为国内科技巨头在生成式AI赛道的最新动作,这样的技术路径与开源策略既体现了行业发展趋势,也折射出阿里在技术竞争中的布局考量。

技术架构差异化尝试

通义万相Wan2.2此次开源的三款模型中,文生视频与图生视频模型采用的MoE架构是最受行业关注的技术点。

通过动态选择部分专家(子模型)参与推理任务,MoE架构能提高模型的计算效率和性能,尤其适用于大型神经网络模型的训练和推理。

这种架构并非凭空出现,而是在现有视频生成技术瓶颈下的针对性设计:将模型拆分为高噪声专家模型与低噪专家模型,前者负责视频整体布局,后者专注细节完善,形成了分工明确的处理机制。

从技术逻辑看,这样的设计直指视频生成长期存在的效率问题。

传统模型在处理长时序视频时,常因参数规模与计算资源的矛盾,难以兼顾质量与效率。

MoE架构通过激活参数的动态调用,在27B总参数量级下能实现14B激活参数的精准分配,使得同参数规模下计算资源消耗减少约50%。

这种资源优化能力,在当前AI大模型训练成本高企的背景下,具备实际应用价值。

参数量总规模27B,激活量高达14B,激活占比超过50%至51.85%。

如此超高的激活占比是怎么做到的?

首先这并非易事,这需要有高度的模型架构设计与优化能力。就像智谱AI发布的旗舰模型GLM-4.5,激活量占比9%,就能实现API价格仅为Claude的10%,原因也是智谱AI拥有对Transformer架构持续积累了长达4年的优化成果。

要构建一个能合理分配不同专家模型职责,确保在不同去噪阶段高噪声专家模型与低噪专家模型有序工作的架构,需要对视频生成过程中的数据流向、处理逻辑有极为精准的把握。

同时,在参数激活的动态管理方面,如何根据输入数据的特征、去噪任务的需求,在众多参数中准确激活对应的14B参数,避免无效激活造成资源浪费,还要保证激活参数间协同工作的高效性,是研发团队面临的巨大挑战。

这涉及到复杂的算法设计与大量的实验调试,以找到最适合视频生成任务的参数激活策略。换句话说,这需要技术团队对模型任务所需要的数据有精确把控,以及为此采取了高效的激活策略和方法。

值得注意的是,MoE架构在NLP(自然语言处理)领域已得到较多应用,但在视频生成领域仍属新鲜事物。

视频数据的时空复杂性远超文本,如何让不同专家模型在处理动态画面时实现无缝协同,是技术落地的关键。

通义万相团队的解决方案是按去噪阶段划分专家职责,这种思路能否成为行业通用范式,还需接受市场验证。

阿里巴巴选择开源这三款模型,在商业策略上颇具深意。

当前AI视频生成领域呈现闭源竞赛与开源探索并行的格局,头部企业多倾向于将核心模型作为商业服务的技术壁垒,而开源模式则试图通过生态共建扩大技术影响力。

从开发者层面看,Wan2.2的开源提供了一个可直接上手的技术样本。

开发者可在GitHub、HuggingFace等平台获取模型代码,这降低了视频生成技术的研究门槛。对于中小企业而言,无需从零构建模型,可基于现有框架进行二次开发,这在一定程度上会加速技术的场景落地。

在行业竞争维度,此次开源可能加剧视频生成技术的迭代速度。此前,国内外已有多家企业推出视频生成模型,但多以闭源API服务为主。

通义万相Wan2.2的开源,相当于向行业公开了部分技术路径,其他企业可能在此基础上优化升级,形成技术反超。

实际应用潜力与局限

从应用场景来看,Wan2.2的5秒高清视频生成能力,目前更适合作为创意工具而非生产工具。

在影视前期策划中,创作者可通过文本或图片快速生成片段,用于可视化创意方案;在广告行业,可辅助制作产品展示短视频的初稿。这些场景对视频时长要求不高,却能显著提升前期沟通效率。

但其局限性也同样明显:单次生成5秒高清视频的时长,意味着复杂叙事仍需人工拼接,与“电影级”的实际生产需求存在差距。

尽管阿里官方表示未来将提升时长,但视频生成时长的延长并非简单的技术叠加,而是需要解决更长时序下的逻辑连贯性、画面一致性等问题,这对模型的时空建模能力提出了更高要求。

在美学控制方面,“电影级美学控制系统”通过参数化调节光影、色彩的设计,确实降低了专业美学表达的门槛。

但这种控制的精准度仍依赖于提示词的专业性,普通用户若缺乏基础美学知识,可能难以充分发挥其功能。

此外,模型生成的画面风格是否能真正达到“电影级”,还需专业创作者的实际使用反馈来验证。

放在全球AI视频生成技术的坐标系中,Wan2.2的开源是中国企业在该领域的一次重要发声。

目前,国际范围内已有模型实现更长时长的视频生成,且在画面真实感上具备优势。

Wan2.2的特色在于MoE架构带来的资源效率提升,这一差异化路径能否在激烈竞争中占据一席之地,取决于其在实际场景中的落地效果。

对于整个行业而言,视频生成技术仍处于快速进化阶段。从文本生成图像到文本生成视频,技术跨越的背后是对算力、数据、算法的综合考验。

Wan2.2的出现,本质上是这一进化过程中的一个技术节点,其价值不在于颠覆行业,而在于为行业提供了一种新的技术选择。

未来,随着模型时长的延长、细节处理能力的提升,视频生成技术可能会逐步渗透到更多领域。但这一过程需要时间,且必然伴随着技术瓶颈的突破与商业模式的验证。

对于企业而言,如何平衡技术研发投入与商业回报,将是比技术突破更难的课题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美媒很感慨:要不是中国还在反抗特朗普,怕是全世界都向他投降了

美媒很感慨:要不是中国还在反抗特朗普,怕是全世界都向他投降了

通文知史
2026-01-20 23:35:03
游资全休息了!雪球震惊市场,多个大V账号被永封,轮回打油诗告别

游资全休息了!雪球震惊市场,多个大V账号被永封,轮回打油诗告别

金石随笔
2026-01-21 00:13:16
中共中央批准,开除高以忱党籍

中共中央批准,开除高以忱党籍

新京报
2026-01-20 11:50:33
机构数据:一线城市餐厅闭店率35% 仅北京人均消费还能过百

机构数据:一线城市餐厅闭店率35% 仅北京人均消费还能过百

西虹市闲话
2025-12-07 12:55:59
U23亚洲杯历史性晋级决赛:胜利对中国足球真的很重要

U23亚洲杯历史性晋级决赛:胜利对中国足球真的很重要

澎湃新闻
2026-01-21 07:57:10
国足挺进亚洲杯决赛,郭广昌奖励8000万,球迷盼早日兑现

国足挺进亚洲杯决赛,郭广昌奖励8000万,球迷盼早日兑现

安逸安逸
2026-01-21 08:53:55
强势拔刺!谢波德救命12分!火箭逆袭马刺,赛后却传来意外打击

强势拔刺!谢波德救命12分!火箭逆袭马刺,赛后却传来意外打击

话体坛
2026-01-21 12:32:52
开拓者召回杨瀚森,7天6赛体能拉爆,工作室回应质疑,队记发声

开拓者召回杨瀚森,7天6赛体能拉爆,工作室回应质疑,队记发声

生活新鲜市
2026-01-21 11:55:02
季克良:工作50年喝掉2吨茅台,退休7年被返聘,今87岁身体硬朗

季克良:工作50年喝掉2吨茅台,退休7年被返聘,今87岁身体硬朗

白面书誏
2026-01-20 00:58:18
CCTV5直播中日U23男足决赛,身价对比有惊喜,宋凯期待实现大突破

CCTV5直播中日U23男足决赛,身价对比有惊喜,宋凯期待实现大突破

体育大学僧
2026-01-21 11:11:45
顾廷海,赴任重庆

顾廷海,赴任重庆

新京报政事儿
2026-01-21 11:39:19
广西一精神小妹结婚,身上多处纹身新郎小她10岁,网友:相当炸裂

广西一精神小妹结婚,身上多处纹身新郎小她10岁,网友:相当炸裂

唐小糖说情感
2026-01-07 16:37:28
最大“骗局”是山姆超市,靠一张 260 元的会员卡一年狂揽 660 亿

最大“骗局”是山姆超市,靠一张 260 元的会员卡一年狂揽 660 亿

南权先生
2026-01-19 15:38:30
马英九建议郑丽文:如去大陆访问,别穿高跟鞋,赶快练毛笔字

马英九建议郑丽文:如去大陆访问,别穿高跟鞋,赶快练毛笔字

扬子晚报
2026-01-20 17:59:47
狂输28分!快船终结6连胜,哈登连创2大NBA神迹,祖巴茨12分背锅

狂输28分!快船终结6连胜,哈登连创2大NBA神迹,祖巴茨12分背锅

老侃侃球
2026-01-21 11:17:49
你是咋意识到自己没见过世面的?网友:书里的杨桃馋了我二十多年

你是咋意识到自己没见过世面的?网友:书里的杨桃馋了我二十多年

解读热点事件
2025-10-06 00:05:03
蒋介石曾愿携旧部回归大陆,提出6个前提条件,毛主席:全部同意

蒋介石曾愿携旧部回归大陆,提出6个前提条件,毛主席:全部同意

云霄纪史观
2026-01-21 05:29:35
iPhone 18上热搜 果粉看完外观后释然:比左上角挖孔好多了

iPhone 18上热搜 果粉看完外观后释然:比左上角挖孔好多了

快科技
2026-01-21 12:37:48
儿子打工9年寄了180万,母亲却没收到过一毛钱,调取监控后揭开真相

儿子打工9年寄了180万,母亲却没收到过一毛钱,调取监控后揭开真相

程哥讲堂
2024-05-06 20:01:02
苹果被曝将推出高端版AirPods Pro 3 或在下半年发布

苹果被曝将推出高端版AirPods Pro 3 或在下半年发布

手机中国
2026-01-21 07:50:09
2026-01-21 13:08:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140418文章数 2652221关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

夫妻吵架丈夫放话"不想活了"后离家出走 警察找了一宿

头条要闻

夫妻吵架丈夫放话"不想活了"后离家出走 警察找了一宿

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

拆解涉税黑中介虚开套路

汽车要闻

新一代理想L9电池加码体型加大 重夺高端话语权

态度原创

教育
艺术
健康
旅游
时尚

教育要闻

最长学期要结束了!南京多校期末考试后安排发布:准备接收神兽!

艺术要闻

一百多年前的中国,太雄伟震撼了!

血常规3项异常,是身体警报!

旅游要闻

Z世代旅行“新三观”:高低配、搭子社交与入心体验

告别93岁时尚传奇Valentino:他留下了全世界最美的“红”

无障碍浏览 进入关怀版