网易首页 > 网易号 > 正文 申请入驻

一张照片+一段音频生成“电影大片”视频!通义万相又一重磅开源

0
分享至

智东西8月27日消息,昨夜,阿里通义万相正式开源全新多模态视频生成模型通义万相Wan2.2-S2V,用户仅需一张静态图片和一段音频,即可通过该模型生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频

Wan2.2-S2V单次生成的视频时长可达分钟级,有望大幅提升数字人直播、影视制作、AI教育等行业的视频创作效率。目前,模型已在通义万相官网、Hugging Face和魔搭社区上线。

7月28日,阿里开源视频生成模型通义万相Wan2.2,包括文生视频Wan2.2-T2V-A14B、图生视频Wan2.2-I2V-A14B和统一视频生成Wan2.2-IT2V-5B三款模型。其中,文生视频模型和图生视频模型为业界首个使用MoE架构的视频生成模型。

8月11日,Wan2.2-I2V-Flash上线, 相比Wan2.1推理速度提升12倍,0.1元/秒,抽卡成功率提升123%。

本次发布并开源的Wan2.2-S2V则更加偏向音频驱动,专攻图像+音频,让画面和音频更加契合。

体验链接:

通义万相官网:https://tongyi.aliyun.com/wanxiang/generate

阿里云百炼API:https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

开源地址:

Github:https://github.com/Wan-Video/Wan2.2

魔搭社区:https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

Hugging Face:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

智东西第一时间对Wan2.2-S2V进行了体验,发现其针对真人角色的视频生成,口型对的很精准,手部或身体其他部分的晃动也十分自然,但在动画角色的五官识别还不太精准,并且该模型免费版本排队时间较长且只有一个排队名额。

一、一张照片+一段音频,就能让图片中的人物开口说话

Wan2.2-S2V可驱动真人、卡通、动物、数字人等类型图片,并支持肖像、半身以及全身等任意画幅,用户上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

点开Wan2.2-S2V主页,可以看到在聊天框下方有两个方框可以选择模式,视频类可以选择“图生视频”“文生视频”“视频特效”等7个功能。

我上传了一张动画人物“吉伊”的图片,并输入文字“让画面中的角色唱歌”:

“吉伊”不仅动了起来,连身边的星星都跟着旋转,还自己配上了bgm,就是嘴巴的线条没有识别准确:

用户如想要生成人物对嘴型的视频,则需选择数字人选项,上传角色图像。音频可以选择自己上传,也可以用AI生成,AI生成的音频需要用户输入想要的台词并选择喜欢的声线,目前还仅支持中文和英文。

比如,让小狗张嘴唱歌:

让爱因斯坦张口说话:

我还上传了一张欧美男生的人物照片和一段中文音频:

Wan2.2-S2V生成的视频不仅能保证人物形象和原图一致,其面部表情和嘴部动作都能与音频基本对齐,视频人物脸上的光线甚至还可以随着嘴形的变化而变化。

此外,该模型还支持文本控制,用户输入Prompt后可对视频画面进行控制,让视频主体的运动和背景的变化更丰富。

再比如,生成一段音乐MV:

画面中的人物不仅可以对上口型,连手部动作和身体摇晃都在音乐的节拍上,车窗外的画面也可以移动,模拟火车行进的真实场景。

二、历史参考帧扩展至73帧,还支持不同分辨率

基于通义万相视频生成基础模型能力,Wan2.2-S2V融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成。

同时该模型还引入AdaIN和CrossAttention两种控制机制,实现了更准确更动态的音频控制效果。

为保障长视频生成效果,Wan2.2-S2V通过层次化帧压缩技术,将motion frames(历史参考帧)的长度从数帧拓展到73帧,从而实现了稳定的长视频生成效果。

Wan2.2-S2V还可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

结语:产业需求推动AI生成视频的技术迭代

文生视频、图生视频赛道真是太卷了。

无论是国内的即梦AI、MiniMax、昆仑万维等,还是国外的Runway、Midjouney等,都在视频生成类大模型上猛下功夫。

就拿通义万相来说,自今年2月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频驱动生视频等多款模型。

当前,数字人直播、影视制作、AI教育等行业对高效视频创作工具的需求日益广泛。

这种旺盛的产业需求,正成为推动视频生成类大模型技术快速迭代的核心动力,也为赛道未来的发展提供了广阔空间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
进口针一支1.7万,年生长11厘米,国人怒了

进口针一支1.7万,年生长11厘米,国人怒了

果壳
2026-06-02 19:13:32
贵州能源集团电力投资有限公司副总工程师、贵州盘江电投发电有限公司副总工程师陈明彦被查

贵州能源集团电力投资有限公司副总工程师、贵州盘江电投发电有限公司副总工程师陈明彦被查

界面新闻
2026-06-02 14:13:55
多个伊拉克民兵组织宣布拟解除武装

多个伊拉克民兵组织宣布拟解除武装

财联社
2026-06-03 01:24:05
“白嫖党”压力来了!吊牌全面升级,用硬塑料卡扣,边缘磨砂处理

“白嫖党”压力来了!吊牌全面升级,用硬塑料卡扣,边缘磨砂处理

火山詩话
2026-06-02 08:54:07
屋漏偏逢连夜雨!60岁郭富城再迎噩耗,方媛疑产后抑郁是冰山一角

屋漏偏逢连夜雨!60岁郭富城再迎噩耗,方媛疑产后抑郁是冰山一角

悄悄史话
2026-05-28 11:44:23
穿着阿森纳球衣庆祝夺冠,WWE女星遭摔角迷调侃!

穿着阿森纳球衣庆祝夺冠,WWE女星遭摔角迷调侃!

乐道足球C
2026-06-02 15:31:22
僵持七年拿不到认证!中国不等了,外媒:已暂停批准空客飞机交付

僵持七年拿不到认证!中国不等了,外媒:已暂停批准空客飞机交付

大卫聊科技
2026-06-02 13:48:50
反常!何超盈缺席弟弟婚礼,疑似与四房关系变淡,反倒亲近何超琼

反常!何超盈缺席弟弟婚礼,疑似与四房关系变淡,反倒亲近何超琼

TVB的四小花
2026-06-02 13:13:49
王嘉尔晒何猷君奚梦瑶婚礼幕后照片 身穿西服当伴郎好帅气

王嘉尔晒何猷君奚梦瑶婚礼幕后照片 身穿西服当伴郎好帅气

TVB的四小花
2026-06-03 01:25:22
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

凡知
2026-06-03 05:12:25
98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

小正说娱乐
2026-05-31 11:33:33
云南元阳客车侧翻事故已致7死12伤,涉事企业被交通运输部通报

云南元阳客车侧翻事故已致7死12伤,涉事企业被交通运输部通报

新京报
2026-06-01 17:26:15
柯基犬预测了马刺打尼克斯的NBA总决赛,此前它已准确预测了西决

柯基犬预测了马刺打尼克斯的NBA总决赛,此前它已准确预测了西决

好火子
2026-06-03 00:43:55
黄仁勋拿下宇树科技,全网破防了!

黄仁勋拿下宇树科技,全网破防了!

新浪财经
2026-06-02 17:08:19
前香奈儿设计师闯入户外:自研“龙脊”专利,3年品牌年销冲击6000万

前香奈儿设计师闯入户外:自研“龙脊”专利,3年品牌年销冲击6000万

字节漫游指南
2026-06-01 11:45:28
暴雨、大暴雨、雷暴大风来袭!多部门六预警齐发!局地将有大雾或冰雹天气|国是早班车

暴雨、大暴雨、雷暴大风来袭!多部门六预警齐发!局地将有大雾或冰雹天气|国是早班车

新浪财经
2026-06-03 04:16:14
葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

每日经济新闻
2026-06-02 23:20:35
俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

闻号说经济
2026-06-02 10:43:10
G4出现名场面!王博亲自为他递水,楼明为他鼓掌:获胜的最大奇兵

G4出现名场面!王博亲自为他递水,楼明为他鼓掌:获胜的最大奇兵

南海浪花
2026-06-03 05:25:34
纽卡官方:拉姆斯代尔等四名球员离队,吉莱斯皮续约一年

纽卡官方:拉姆斯代尔等四名球员离队,吉莱斯皮续约一年

懂球帝
2026-06-03 00:09:06
2026-06-03 08:00:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11959文章数 117090关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

教育
时尚
健康
亲子
军事航空

教育要闻

校长最强大的内心素养,就2个字 | 余国庆

蓝色系下装看着清爽不闷,裤子、裙子都凉快,随便穿都不出错

违规干细胞应用,暗藏致命隐患!

亲子要闻

姐弟俩画画的欢乐时光

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版