网易首页 > 网易号 > 正文 申请入驻

阿里开源视频生成模型 Wan2.2-S2V,一张图生成电影级数字人视频

0
分享至

IT之家 8 月 26 日消息,今日晚间,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。

据介绍,该模型单次生成的视频时长可达分钟级,大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。


目前,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,让视频主体的运动和背景的变化更丰富。

例如,上传一张人物弹钢琴的照片、一段歌曲和一段文字,Wan2.2-S2V 即可生成一段完整、声情并茂的钢琴演奏视频,不仅能保证人物形象和原图一致,其面部表情和嘴部动作还能与音频对齐,视频人物的手指手型、力度、速度也能完美匹配音频节奏。


据介绍,Wan2.2-S2V 采用了基于通义万相视频生成基础模型能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;同时引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果;为保障长视频生成效果,Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames (IT之家注:历史参考帧) 的长度从数帧拓展到 73 帧,从而实现了稳定的长视频生成效果。

在模型训练上,通义团队构建了超 60 万个片段的音视频数据集,通过混合并行训练进行全参数化训练,充分挖掘了模型的性能。同时通过多分辨率训练、支持模型多分辨率的推理,可支持不同分辨率场景的视频生成需求,如竖屏短视频、横屏影视剧。


实测数据显示,Wan2.2-S2V 在 FID(视频质量,越低越好)、EFID(表情真实度,越低越好)、CSIM(身份一致性,越高越好)等核心指标上取得了同类模型最好的成绩。

阿里云表示,自今年 2 月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频生视频等多款模型,在开源社区和三方平台的下载量已超 2000 万。

开源地址:

  • GitHub:https://github.com/Wan-Video/Wan2.2
  • 魔搭社区:https://www.modelscope.cn/ models / Wan-AI / Wan2.2-S2V-14B
  • HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

体验地址:

  • 通义万相官网:https://tongyi.aliyun.com/ wanxiang / generate
  • 阿里云百炼:https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

火山诗话
2025-11-07 13:42:14
古二再度放料!秦雯王家卫吐槽出现新人物,陈坤周迅被嘲开班骗稿

古二再度放料!秦雯王家卫吐槽出现新人物,陈坤周迅被嘲开班骗稿

萌神木木
2025-11-08 15:21:49
东风就位!神舟二十号3人乘组整装回家,神二十二1人将驻留超1年

东风就位!神舟二十号3人乘组整装回家,神二十二1人将驻留超1年

粤语音乐喷泉
2025-11-08 02:56:22
“三十如狼,四十如虎”,17分钟不雅视频,曾医生确实更主动一些

“三十如狼,四十如虎”,17分钟不雅视频,曾医生确实更主动一些

汉史趣闻
2025-11-07 15:54:10
悲催!东莞一家30年大厂轰然倒下,负债2个亿,近2000人面临失业

悲催!东莞一家30年大厂轰然倒下,负债2个亿,近2000人面临失业

火山诗话
2025-11-08 10:42:07
对话张家界荒野求生赛事总策划人:最佩服“冷美人”但她难夺冠,没有办MCN公司签约选手的计划

对话张家界荒野求生赛事总策划人:最佩服“冷美人”但她难夺冠,没有办MCN公司签约选手的计划

极目新闻
2025-11-08 17:31:47
上海一大学生网购“通用钥匙”关掉100多部电梯广告!律师:或面临三重法律责任

上海一大学生网购“通用钥匙”关掉100多部电梯广告!律师:或面临三重法律责任

极目新闻
2025-11-08 12:56:06
马斯克认错:特斯拉4680电池干电极工艺是"重大失误",竞争对手已领先

马斯克认错:特斯拉4680电池干电极工艺是"重大失误",竞争对手已领先

新浪财经
2025-11-08 12:26:51
拍案叫绝!主席如何识破101阴险两面派?居然是一次不起眼的谈话!

拍案叫绝!主席如何识破101阴险两面派?居然是一次不起眼的谈话!

博览历史
2023-12-23 18:40:48
副院长视频后续:眼科女主任很爱干净,沙发上铺了两张无菌床单

副院长视频后续:眼科女主任很爱干净,沙发上铺了两张无菌床单

鋭娱之乐
2025-11-07 15:50:06
天塌了!一夜之间4家公司被立案,27万股东集体踩雷

天塌了!一夜之间4家公司被立案,27万股东集体踩雷

财经智多星
2025-11-08 08:25:14
女演员黄慧颐现状:开老书店维生,老态明显,曾被称广东标准媳妇

女演员黄慧颐现状:开老书店维生,老态明显,曾被称广东标准媳妇

动物奇奇怪怪
2025-11-08 01:04:22
张家界荒野求生选手抓到了野猪,吃得满嘴流油!网友:丢的骨头都比其他选手的食物好

张家界荒野求生选手抓到了野猪,吃得满嘴流油!网友:丢的骨头都比其他选手的食物好

极目新闻
2025-11-08 19:06:51
好事:多名民营企业家获罪后改判,或与中国欲积极加入CPTPP 协定有关

好事:多名民营企业家获罪后改判,或与中国欲积极加入CPTPP 协定有关

蛙蛙和洼
2025-11-08 10:01:55
焦点速递:红军村俄军被迫按下暂停键,欧洲军工火力全开超越俄国

焦点速递:红军村俄军被迫按下暂停键,欧洲军工火力全开超越俄国

史政先锋
2025-11-08 10:34:15
那么优秀的曾医生,为什么会如此主动呢

那么优秀的曾医生,为什么会如此主动呢

大张的自留地
2025-11-08 14:39:50
豪掷150亿,特斯拉要“去中国化”!

豪掷150亿,特斯拉要“去中国化”!

金投网
2025-11-07 16:20:25
福建舰官宣入列,解放军再次重磅围岛,马英九喊话赖清德和郑丽文

福建舰官宣入列,解放军再次重磅围岛,马英九喊话赖清德和郑丽文

时时有聊
2025-11-07 21:55:13
拦车要50条烟后续:曝光者被“制裁”,新娘气哭,街道办回应亮了

拦车要50条烟后续:曝光者被“制裁”,新娘气哭,街道办回应亮了

奇思妙想草叶君
2025-11-07 23:00:07
员工一句话干掉泡泡玛特百亿市值,股价已跌40%

员工一句话干掉泡泡玛特百亿市值,股价已跌40%

蓝洞新消费
2025-11-08 09:32:36
2025-11-08 21:35:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314153文章数 606721关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

亲子
艺术
健康
手机
家居

亲子要闻

此时此刻,幸福具象化了(发个娘家的库存)

艺术要闻

40岁老板娘风流成性,同时交往多名男友!被情人痛下杀手...

超声探头会加重受伤情况吗?

手机要闻

一加15T再次被确认:规格已基本清晰!iQOO 15 mini:待定中!

家居要闻

现代自由 功能美学居所

无障碍浏览 进入关怀版