网易首页 > 网易号 > 正文 申请入驻

阿里开源视频生成模型 Wan2.2-S2V,一张图生成电影级数字人视频

0
分享至

IT之家 8 月 26 日消息,今日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。

据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。


目前,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,让视频主体的运动和背景的变化更丰富。

例如,上传一张人物弹钢琴的照片、一段歌曲和一段文字,Wan2.2-S2V 即可生成一段完整、声情并茂的钢琴演奏视频,不仅能保证人物形象和原图一致,其面部表情和嘴部动作还能与音频对齐,视频人物的手指手型、力度、速度也能完美匹配音频节奏。


据介绍,Wan2.2-S2V 采用了基于通义万相视频生成基础模型能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;同时引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果;为保障长视频生成效果,Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames (IT之家注:历史参考帧) 的长度从数帧拓展到 73 帧,从而实现了稳定的长视频生成效果。

在模型训练上,通义团队构建了超 60 万个片段的音视频数据集,通过混合并行训练进行全参数化训练,充分挖掘了模型的性能。同时通过多分辨率训练、支持模型多分辨率的推理,可支持不同分辨率场景的视频生成需求,如竖屏短视频、横屏影视剧。


实测数据显示,Wan2.2-S2V 在 FID(视频质量,越低越好)、EFID(表情真实度,越低越好)、CSIM(身份一致性,越高越好)等核心指标上取得了同类模型最好的成绩。

阿里云表示,自今年 2 月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频生视频等多款模型,在开源社区和三方平台的下载量已超 2000 万。

开源地址:

  • GitHub:https://github.com/Wan-Video/Wan2.2
  • 魔搭社区:https://www.modelscope.cn/ models / Wan-AI / Wan2.2-S2V-14B
  • HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

体验地址:

  • 通义万相官网:https://tongyi.aliyun.com/ wanxiang / generate
  • 阿里云百炼:https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
半导体开启涨停潮!下周,这几只标的有望继续被资金追捧

半导体开启涨停潮!下周,这几只标的有望继续被资金追捧

证券市场周刊
2026-01-18 13:53:39
特朗普发布个人黑白照

特朗普发布个人黑白照

环球时报国际
2026-01-18 16:09:01
携程被调查背后:控制70%市场,毛利率80%,股东名单7家美国资本

携程被调查背后:控制70%市场,毛利率80%,股东名单7家美国资本

简易科技
2026-01-18 16:59:09
文班亚马39分9篮板马刺拒绝逆转险胜森林狼,爱德华兹复出55分

文班亚马39分9篮板马刺拒绝逆转险胜森林狼,爱德华兹复出55分

湖人崛起
2026-01-18 11:35:56
这些时代人物先后离场,香港一代人的记忆正在谢幕...

这些时代人物先后离场,香港一代人的记忆正在谢幕...

港漂圈
2026-01-04 20:18:12
“火云邪神”梁小龙去世!两任妻子颜值高,为前妻治病狂花400万

“火云邪神”梁小龙去世!两任妻子颜值高,为前妻治病狂花400万

鋭娱之乐
2026-01-18 20:39:59
全职主妇屡遭丈夫责骂吞30多粒安眠药!丈夫:她觉得她是美女嫁我可惜,女同事都夸我很优秀

全职主妇屡遭丈夫责骂吞30多粒安眠药!丈夫:她觉得她是美女嫁我可惜,女同事都夸我很优秀

扬子晚报
2026-01-18 11:11:45
尚可喜家族参与三藩之乱,为何没有遭到康熙清算,反而显赫到清末

尚可喜家族参与三藩之乱,为何没有遭到康熙清算,反而显赫到清末

掠影后有感
2026-01-18 14:14:43
我国在南海有大动作?羚羊礁疑似准备填岛,三大理由很有说服力

我国在南海有大动作?羚羊礁疑似准备填岛,三大理由很有说服力

全城探秘
2026-01-18 11:25:43
董宇辉压力来了!李亚鹏的直播间一下涌入超10万,登顶带货榜第一

董宇辉压力来了!李亚鹏的直播间一下涌入超10万,登顶带货榜第一

火山诗话
2026-01-18 09:59:01
米娜酒后直播耍酒疯,先脱衣服后劈叉,粉丝刷礼物后大方展示身材

米娜酒后直播耍酒疯,先脱衣服后劈叉,粉丝刷礼物后大方展示身材

新游戏大妹子
2026-01-17 13:16:15
确认!无锡湖滨饭店!

确认!无锡湖滨饭店!

无锡eTV全媒体
2026-01-18 20:15:07
「暴风」击落21架俄无人机 提升乌防空效能

「暴风」击落21架俄无人机 提升乌防空效能

鱼莫语
2026-01-16 19:34:27
Nature重磅!孩子长不高,竟是这个常见食物吃多了?

Nature重磅!孩子长不高,竟是这个常见食物吃多了?

医学界
2026-01-17 23:20:24
三次婚姻两度丧子!59岁无子女的张卫健,王晶为何称毫无悲惨

三次婚姻两度丧子!59岁无子女的张卫健,王晶为何称毫无悲惨

胡一舸南游y
2026-01-17 13:40:05
印度不信邪,再买114架阵风战机却猛然发现:中国将有1000架歼-20

印度不信邪,再买114架阵风战机却猛然发现:中国将有1000架歼-20

达文西看世界
2026-01-18 22:13:50
与富商海外产子真相大白7个月,江疏影近况曝光,王传君的话没错

与富商海外产子真相大白7个月,江疏影近况曝光,王传君的话没错

巧手晓厨娘
2026-01-16 15:43:20
李昊:杨皓宇失点后我跟他说,我再给你扑一个出来

李昊:杨皓宇失点后我跟他说,我再给你扑一个出来

懂球帝
2026-01-18 16:36:07
加拿大跑了,中国也撤了,日本和英国却含泪接盘,美债怎么了

加拿大跑了,中国也撤了,日本和英国却含泪接盘,美债怎么了

社会日日鲜
2026-01-18 09:54:11
真实世界数据揭示:电动汽车电池寿命可达13年,年均衰减率仅2.3%

真实世界数据揭示:电动汽车电池寿命可达13年,年均衰减率仅2.3%

IT之家
2026-01-18 16:46:09
2026-01-18 23:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
325196文章数 606888关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

欧盟"外长":特朗普的关税威胁分裂欧美 会让中国受益

头条要闻

欧盟"外长":特朗普的关税威胁分裂欧美 会让中国受益

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

艺术
时尚
教育
健康
数码

艺术要闻

她是越南的绝世美人,你绝对不想错过!

美拉德过时了?今年冬天最火的4个颜色竟然是它们

教育要闻

这所“教科附”系,迎来“七中系”出身的新校长!

血常规3项异常,是身体警报!

数码要闻

双3D缓存新王登基!AMD锐龙9 9950X3D2跑分曝光:单多核均超9950X3D

无障碍浏览 进入关怀版