网易首页 > 网易号 > 正文 申请入驻

一张照片+一段音频生成“电影大片”视频!通义万相又一重磅开源

0
分享至

智东西8月27日消息,昨夜,阿里通义万相正式开源全新多模态视频生成模型通义万相Wan2.2-S2V,用户仅需一张静态图片和一段音频,即可通过该模型生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频

Wan2.2-S2V单次生成的视频时长可达分钟级,有望大幅提升数字人直播、影视制作、AI教育等行业的视频创作效率。目前,模型已在通义万相官网、Hugging Face和魔搭社区上线。

7月28日,阿里开源视频生成模型通义万相Wan2.2,包括文生视频Wan2.2-T2V-A14B、图生视频Wan2.2-I2V-A14B和统一视频生成Wan2.2-IT2V-5B三款模型。其中,文生视频模型和图生视频模型为业界首个使用MoE架构的视频生成模型。

8月11日,Wan2.2-I2V-Flash上线, 相比Wan2.1推理速度提升12倍,0.1元/秒,抽卡成功率提升123%。

本次发布并开源的Wan2.2-S2V则更加偏向音频驱动,专攻图像+音频,让画面和音频更加契合。

体验链接:

通义万相官网:https://tongyi.aliyun.com/wanxiang/generate

阿里云百炼API:https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

开源地址:

Github:https://github.com/Wan-Video/Wan2.2

魔搭社区:https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

Hugging Face:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

智东西第一时间对Wan2.2-S2V进行了体验,发现其针对真人角色的视频生成,口型对的很精准,手部或身体其他部分的晃动也十分自然,但在动画角色的五官识别还不太精准,并且该模型免费版本排队时间较长且只有一个排队名额。

一、一张照片+一段音频,就能让图片中的人物开口说话

Wan2.2-S2V可驱动真人、卡通、动物、数字人等类型图片,并支持肖像、半身以及全身等任意画幅,用户上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

点开Wan2.2-S2V主页,可以看到在聊天框下方有两个方框可以选择模式,视频类可以选择“图生视频”“文生视频”“视频特效”等7个功能。

我上传了一张动画人物“吉伊”的图片,并输入文字“让画面中的角色唱歌”:

“吉伊”不仅动了起来,连身边的星星都跟着旋转,还自己配上了bgm,就是嘴巴的线条没有识别准确:

用户如想要生成人物对嘴型的视频,则需选择数字人选项,上传角色图像。音频可以选择自己上传,也可以用AI生成,AI生成的音频需要用户输入想要的台词并选择喜欢的声线,目前还仅支持中文和英文。

比如,让小狗张嘴唱歌:

让爱因斯坦张口说话:

我还上传了一张欧美男生的人物照片和一段中文音频:

Wan2.2-S2V生成的视频不仅能保证人物形象和原图一致,其面部表情和嘴部动作都能与音频基本对齐,视频人物脸上的光线甚至还可以随着嘴形的变化而变化。

此外,该模型还支持文本控制,用户输入Prompt后可对视频画面进行控制,让视频主体的运动和背景的变化更丰富。

再比如,生成一段音乐MV:

画面中的人物不仅可以对上口型,连手部动作和身体摇晃都在音乐的节拍上,车窗外的画面也可以移动,模拟火车行进的真实场景。

二、历史参考帧扩展至73帧,还支持不同分辨率

基于通义万相视频生成基础模型能力,Wan2.2-S2V融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成。

同时该模型还引入AdaIN和CrossAttention两种控制机制,实现了更准确更动态的音频控制效果。

为保障长视频生成效果,Wan2.2-S2V通过层次化帧压缩技术,将motion frames(历史参考帧)的长度从数帧拓展到73帧,从而实现了稳定的长视频生成效果。

Wan2.2-S2V还可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

结语:产业需求推动AI生成视频的技术迭代

文生视频、图生视频赛道真是太卷了。

无论是国内的即梦AI、MiniMax、昆仑万维等,还是国外的Runway、Midjouney等,都在视频生成类大模型上猛下功夫。

就拿通义万相来说,自今年2月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频驱动生视频等多款模型。

当前,数字人直播、影视制作、AI教育等行业对高效视频创作工具的需求日益广泛。

这种旺盛的产业需求,正成为推动视频生成类大模型技术快速迭代的核心动力,也为赛道未来的发展提供了广阔空间。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
悲哀!42岁男子一直没找到工作,被父亲怒斥好吃懒做,哭诉怎么办

悲哀!42岁男子一直没找到工作,被父亲怒斥好吃懒做,哭诉怎么办

火山詩话
2026-03-30 07:02:48
英德同时对美展现立场,特朗普仅剩一条路可走

英德同时对美展现立场,特朗普仅剩一条路可走

史政先锋
2026-03-30 07:11:46
还记得利物浦“纹身哥”吗?梅雷莱斯退役10年,生活竟比踢球更狂

还记得利物浦“纹身哥”吗?梅雷莱斯退役10年,生活竟比踢球更狂

仰卧撑FTUer
2026-03-30 10:48:05
我们可能误判了,万斯正切割特朗普,这场采访背后的算计远超想象

我们可能误判了,万斯正切割特朗普,这场采访背后的算计远超想象

报君知史
2026-03-30 15:02:15
CBA焦点战今夜打响!CCTV5直播!辽宁拒3连败,山东北京冲前4

CBA焦点战今夜打响!CCTV5直播!辽宁拒3连败,山东北京冲前4

老吴说体育
2026-03-30 10:44:00
鸿蒙智行遭大规模围攻!享界S9动了谁的蛋糕?

鸿蒙智行遭大规模围攻!享界S9动了谁的蛋糕?

少数派报告Report
2026-03-28 14:26:39
陈妍希红毯胖出新高度!臀肥大、后背勒出两层肉,裙子被撑到崩开

陈妍希红毯胖出新高度!臀肥大、后背勒出两层肉,裙子被撑到崩开

观察鉴娱
2026-03-28 10:00:00
小马科斯又要抱中国佛脚!真怕中国不来东盟峰会,又要紧急会晤

小马科斯又要抱中国佛脚!真怕中国不来东盟峰会,又要紧急会晤

阿晪美食
2026-03-30 16:30:43
释新闻|被中方制裁的日众议员古屋圭司:高市早苗心腹,多次参拜靖国神社

释新闻|被中方制裁的日众议员古屋圭司:高市早苗心腹,多次参拜靖国神社

澎湃新闻
2026-03-30 13:50:26
【列国鉴】记者观察:伊朗战事持续一月,特朗普政府陷入四重困境

【列国鉴】记者观察:伊朗战事持续一月,特朗普政府陷入四重困境

新华社
2026-03-29 13:47:07
李梓萌,私生活传闻太荒唐

李梓萌,私生活传闻太荒唐

做一个合格的吃瓜群众
2026-03-21 19:20:55
够狠!阿联酋清空伊朗人居留权,5300亿资产说冻就冻

够狠!阿联酋清空伊朗人居留权,5300亿资产说冻就冻

老马拉车莫少装
2026-03-29 19:12:12
北京男子靠龙虾OpenClaw实现36小时买房

北京男子靠龙虾OpenClaw实现36小时买房

齐鲁壹点
2026-03-30 11:45:46
朝鲜导游对中国游客说,中国有几个方面不如朝鲜,他们说的对吗?

朝鲜导游对中国游客说,中国有几个方面不如朝鲜,他们说的对吗?

番外行
2026-03-29 00:15:03
砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

娱乐圈的笔娱君
2026-03-26 12:15:32
韩国军事专家:这个世界上没有任何一个国家敢动中国

韩国军事专家:这个世界上没有任何一个国家敢动中国

南权先生
2026-03-12 16:14:24
南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

白云故事
2025-03-14 19:05:07
伊朗同意再放行20艘巴基斯坦籍船只通过霍尔木兹海峡,今后每天将有两艘船通过该海峡

伊朗同意再放行20艘巴基斯坦籍船只通过霍尔木兹海峡,今后每天将有两艘船通过该海峡

扬子晚报
2026-03-29 07:17:05
狂输52!31-0,创史上最拉胯零封纪录,状元啊!

狂输52!31-0,创史上最拉胯零封纪录,状元啊!

体育新角度
2026-03-30 16:14:07
44岁人艺演员于明加,红T恤穿出S曲线,这身材谁敢信是两娃妈?

44岁人艺演员于明加,红T恤穿出S曲线,这身材谁敢信是两娃妈?

娱乐领航家
2026-03-29 23:30:03
2026-03-30 17:16:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11465文章数 117018关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

单套最低5400万 北京豪宅暴雷几十户业主办不了房产证

头条要闻

单套最低5400万 北京豪宅暴雷几十户业主办不了房产证

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

本地
旅游
亲子
艺术
公开课

本地新闻

用Color Walk的方式解锁城市春日

旅游要闻

赴泰旅游价格或上涨,泰国拟向外国游客收300泰铢

亲子要闻

别再给孩子吃这3种“假早餐”,越吃越没精神

艺术要闻

600 年前的「产亡孤魂」,藏着中国女性最痛的记忆

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版