网易首页 > 网易号 > 正文 申请入驻

国产AI视频炸了!SkyReels-V3三大功能重磅开源,1张图生成逼真视频

0
分享至

  

  新智元报道

  编辑:犀牛 KingHZ

  【新智元导读】超越主流商业模型!SkyReels-V3在参考一致性、视频质量上碾压对手,构建200组测试基准,影视、电商、广告场景全覆盖,真正降维打击。

  起猛了!

  马斯克和孙悟空同框了。

  

  更离谱的是:这种「真假难辨」的视频,现在一张图 + 几句话就能做出来。

  不仅普通创作者能直接上手,而且开发者也能二次开发。

  作为迭代自V1(AI短剧创作)、V2(无限时长电影生成)的重磅版本,昆仑天工SkyworkAI团队正式开源了多模态视频生成模型SkyReels-V3:

  论文:https://arxiv.org/abs/2601.17323

  开源:https://github.com/SkyworkAI/SkyReels-V3

  API链接(限时免费):https://www.apifree.ai/model/skywork-ai/skyreels-v3/standard/single-avatar

  这不仅仅是一个模型的发布,更像是一场对现有AI视频工具的「降维打击」。

  AI视频创作三大难事,

  一次做全了

  以前做AI视频,你需要在A模型生图、B模型动效、C模型对口型之间反复横跳。

  而SkyReels-V3这次主打一个全能通吃,在一个架构里搞定三大核心能力:

  1)参考图像转视频:给1–4张图+文本指令,生成多主体视频。重点是: 主角不乱变,告别抽卡式创作。

  2)视频延长:把5秒镜头扩到30秒,还能加转场。重点是: 画面连续、动作不「抽帧」。

  3)音频驱动虚拟形象:一张肖像+一段音频,生成分钟级视频。重点是: 嘴型对得上、人物稳得住 。

  AI视频的门槛正在被铲平:创作者拿到的是趁手的工具,开发者拿到的是万能的模块。

  参考图像转视频:主角就是主角

  如果一个电商运营今晚就要把新品视频上架,但他现在手里只有三张图:商品主图、模特上身图、品牌Logo。

  传统做法?要么找外包烧钱,要么自己用剪辑软件硬搓。

  SkyReels-V3的玩法则是:1到4张参考图+一句文本指令,等待几分钟,一条15秒的高保真产品广告就生成了。

  直出一段多主体、高连贯的视频。

  你可以这么下指令:

  模特拿起商品转身展示,镜头从近景推到中景,背景保持干净明亮。

  Logo始终在右下角,商品纹理要清晰,动作别抽搐。

  它要解决的不是「会动」,而是更难的事:「像同一个人、同一个商品、在同一个世界里连续发生」

  在SkyReels-V3眼里,参考图像不再只是灵感,而是一份「身份合同」——主角签了字,就别想临场变脸。

  其参考一致性得分高达0.6698,视觉质量0.8119,这两个核心指标,直接超越了市面上的主流商业模型。

  比如,让马斯克免费给你带货,或者生成一段极具质感的运动鞋广告:

  没有任何诡异的形变,只有丝滑的商业级质感。

  1简洁明亮的展区内,柔和的灯光均匀洒落,周围摆放着一些运动相关的小物件。一位身穿黑色上衣的男士正仔细地向大家展示一双设计简洁、配色亮丽的运动鞋。

  之前,Gemini 3生成的硅谷巨头大合照,很火很逼真:

  

  现在,SkyReel-V3直接让图片动起来了──

  这质量,这还原度,这一致性,真不是吹!

  视频延长:5秒变30秒, AI 学会了「导演思维」

  做过视频的人都知道,视频延长是个技术活。

  你有一个5秒的空镜头,氛围很好,但太短了。

  传统做法要么重拍,要么靠后期「魔法」——变速、复制帧、加特效遮掩,但怎么弄都有点假。

  SkyReels-V3的视频延长功能,不仅可以把5秒的素材平滑扩展到30秒,更绝的是,它「懂镜头语言」。

  它内置了5种专业转场效果切入、切出、多角度切换、正反镜头、切离

  比如,第一个视频延长到15秒:

  你不只是在「拉长」视频,而是在即时即兴剪辑。

  比如,将一段小姐姐骑车的3秒视频延长到9秒:

  

  视频延展后,无论小姐姐的主体还是视频背景,都完美保持一致,仿佛摄影师真的扛着摄像机跟拍了一路。

  

  再比如,我们将这个林妹妹与鲁智深对话的脑洞视频,加入「多角度切换」的转场。

  

  The two people sat facing each other and talked.

  这种人物一致性,简直绝了。

  

  Switch to a long shot, with the two people talking face to face.

  从技术上说,这得益于它的「统一多分段位置编码」和「鲁棒时空建模」。

  听起来很硬核,本质上就是让AI理解了视频里的「时间逻辑」和「空间关系」,所以延长出来的内容才会顺滑如丝,没有那种AI常见的时空扭曲感。

  一句话:SkyReels-V3把素材不足从一场灾难,变成了一个可控的工程问题。

  音频驱动虚拟形象:一张图+一段声就能「开口说话」

  这是SkyReels-V3最让人兴奋的能力之一。

  输入一张人像照片,再配上一段音频——

  可以是你的录音,可以是AI合成的语音,甚至可以是一段采访素材。

  模型会生成一段视频,让照片里的人瞬间「活过来」:

  嘴唇动作和音频精准同步,表情自然变化,头部还有轻微的摆动,仿佛真人在镜头前呼吸。

  比如,一张小姐姐的图片加上一小段音频,就能生成小姐姐唱歌的片段。

  最厉害的是,它不挑食。

  不只是真人照片,卡通角色、动物形象、二次元立绘,统统可以驱动。

  比如,使用一张小狗照片+一段音频,就可以一步生成「小狗深情演唱」的视频,时长甚至支持分钟级生成。

  你甚至可以让两个角色在同一个画面里对话。

  只需上传一张图片加上几段音频,SkyReels-V3便能够自行判断出音频对应的人物,在说话和聆听状态之间自然切换。

  SkyReels-V3这项能力的音视频同步性得分高达8.18,视觉质量4.60,比肩甚至超越了行业顶尖的OmniHuman 1.5

  为什么是SkyReels-V3?

  领先三大维度

  在AI视频生成领域,「全能选手」向来稀缺。

  SkyReels-V3的出现,打破了这一格局——它是目前少数能在单一架构内同时实现参考图像生成视频、视频延展、音频驱动虚拟人三大核心能力的模型。

  SkyReels-V3敢称行业标杆,底气何在?

  在最考验硬实力的参考图像转视频领域,SkyReels研究团队构建了一个包含200组测试数据的评估基准,涵盖影视、电商、广告等多元场景,参考图像类型覆盖人物、动物、物体和背景。

  结果显示,在参考一致性、视频质量这两个核心指标上,SkyReels-V3直接超越了市面上的主流商业模型。

  作为一个开源模型,这是对闭源阵营的一次强力挑战。

  

  视频延展是SkyReels-V3的另一大杀手锏。

  为实现这一能力,研究团队开发了镜头切换检测器,可分析长视频中是否存在转场及其类型。

  配合统一的多片段位置编码和分层数据训练,模型能够精准建模运动轨迹,在复杂的多片段视频延展中实现平滑过渡。

  输出支持720p分辨率,单镜头延展时长可达30秒,支持1:1、3:4、4:3、16:9、9:16等多种画幅比例。

  在音频驱动虚拟形象生成领域,SkyReels-V3同样表现亮眼。

  音视频同步性得分8.18,视觉质量4.60。这些数据比肩甚至在部分指标上超越了行业顶尖的OmniHuman 1.5。

  

  虚拟形象生成的难点在于唇形同步长时序稳定性

  SkyReels-V3支持720p、24fps的高清视频输出,唇部动作能够精准对齐音素级别的音频动态。

  更关键的是,它支持分钟级视频的单次生成——不是靠多段拼接,而是一次性前向推理完成,全程保持身份一致、动作连贯、表情稳定。这使它天然适用于教学视频、新闻播报、长篇故事等场景。

  值得一提的是,SkyReels-V3还支持多人场景

  在对话场景中,角色能够正确响应对话音频,在说话和聆听状态之间自然切换。

  SkyReels-V3是真开源

  市面上做AI视频生成的模型不少,但SkyReels-V3是真开源

  很多所谓的「开源」模型,要么只开放部分权重,要么限制商用,要么文档稀烂根本跑不起来。

  SkyReels-V3是完整开源,代码托管在GitHub,支持个人和企业自由下载、本地部署、定制改造。

  对于中小团队来说,这意味着零成本获得顶级AI视频能力的可能。无需支付高昂的API调用费用,无需担心数据隐私问题,完全可以在自己的服务器上跑通全流程。

  如果你是开发者:你要的可能不是「看Demo」,而是把能力接进流程。

  把SkyReels-V3当成一个模块,接到你的脚本生成、素材管理、投放系统里——这就是开源生态的意义。

  最后,真正能把开源模型做成「生态」的,从来不是发布那一刻,而是你把作品发出来的那一刻。

  下载、跑通、生成第一条视频,然后把你的prompt和结果分享出来——

  让更多人站在你的肩膀上继续迭代。

  视频创作的「奇点」时刻

  从V1的短剧尝试,到V2的电影梦想,再到今天V3的全能爆发,SkyworkAI团队正在用技术填平专业视频制作的沟壑。

  SkyReels-V3的出现,标志着高保真、长时长、多模态的视频生成能力正式从「尝鲜」走向「实用」。它把原本属于专业工作室的权利,交还给了每一个有故事要讲的人。

  在AI的辅助下,未来的斯皮尔伯格可能就诞生在你的代码仓库里。

  工具已经备好,现在,请开始你的表演。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

马刺大胜送灰熊出局,本赛季常规赛西部前十球队已全部出炉

懂球帝
2026-03-26 12:27:11
押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

小舟谈历史
2026-03-25 06:28:02
台退将提出要求:台湾可以和平回归,但大陆必须要答应2个条件!

台退将提出要求:台湾可以和平回归,但大陆必须要答应2个条件!

百态中的情感起伏
2026-02-16 01:27:29
做人一定不要像张雪峰

做人一定不要像张雪峰

罗sir财话
2026-03-24 21:59:56
东北超长春主帅:大连很强?我可以不客气地说,我们是最好的

东北超长春主帅:大连很强?我可以不客气地说,我们是最好的

懂球帝
2026-03-26 14:13:09
唯一不含草酸的蔬菜!比荠菜、韭菜还鲜嫩,鲜嫩营养正当时,好吃

唯一不含草酸的蔬菜!比荠菜、韭菜还鲜嫩,鲜嫩营养正当时,好吃

阿龙美食记
2026-03-24 09:50:48
乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

项鹏飞
2026-03-26 21:13:57
陕西关中行政区划调整的构想

陕西关中行政区划调整的构想

普陀动物世界
2026-03-26 12:44:53
张雪峰妻子李丽婧的相关消息引发关注

张雪峰妻子李丽婧的相关消息引发关注

静水流深003
2026-03-26 12:19:49
运势封神!3.30-4.5三大星座事业翻身,之前没白熬,接好运

运势封神!3.30-4.5三大星座事业翻身,之前没白熬,接好运

别人都叫我阿螫
2026-03-25 14:34:30
原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

证券时报e公司
2026-03-26 22:23:23
真正的双赢!两大全明星一换一,一人完美融入,另一人则重获新生

真正的双赢!两大全明星一换一,一人完美融入,另一人则重获新生

大卫的篮球故事
2026-03-25 21:47:25
为什么中国不军事援助伊朗?看完发现,印度三哥才是最牛逼的

为什么中国不军事援助伊朗?看完发现,印度三哥才是最牛逼的

番外行
2026-03-14 08:55:36
欧股、美股期货全线下挫,美股芯片股、中概股盘前普跌,阿里巴巴跌超3%,原油拉升涨超3%

欧股、美股期货全线下挫,美股芯片股、中概股盘前普跌,阿里巴巴跌超3%,原油拉升涨超3%

21世纪经济报道
2026-03-26 19:46:02
3月26日俄乌:乌克兰的猛烈回击

3月26日俄乌:乌克兰的猛烈回击

山河路口
2026-03-26 17:32:00
核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

国是直通车
2026-03-22 16:00:02
全是智商税!这5个被吹爆的“网红产物”,谁买谁后悔

全是智商税!这5个被吹爆的“网红产物”,谁买谁后悔

家居设计师苏哥
2026-03-24 13:47:31
知名歌手公开玩性感美女大作!网友赌他"最多十分钟"

知名歌手公开玩性感美女大作!网友赌他"最多十分钟"

游民星空
2026-03-26 17:09:32
特朗普希望破灭了,但是福特号航母上4500名美军士兵却彻底安全了

特朗普希望破灭了,但是福特号航母上4500名美军士兵却彻底安全了

安安说
2026-03-26 11:41:14
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
2026-03-26 23:32:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
本地
时尚
健康
公开课

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

这些才是适合春季的穿搭!不沉闷、不单调,大方靓丽又减龄

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版