网易首页 > 网易号 > 正文 申请入驻

这个真人版《火影》竟然是AI做的,来自中国AI视频新王者Vidu Q3

0
分享至

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

开年第一个月,国产AI真的是卷没边儿了。

这不,AI视频生成圈又新鲜出炉了个大的——

全球首个支持一口气生成16秒音视频直出的AI!

然后啊,我反手就做一个真人版《火影忍者》第四次忍界大战的名场面,请欣赏:



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

如何?是不是从画面到台词再到音效,都有原版日漫的那个味道了?

而制作这部真人剧背后的模型,正是生数科技新鲜出炉的Vidu Q3

在体验一番下来,最大的感受就是全自动

  • 视频和音频是一次性一锅出的
  • 运镜和转场是自由切换一步到位的
  • 文字和图片都能生成音视频的
  • 清晰度是支持1080P的(生成后可提升至4K)
  • 叙事能力是完整的、文字渲染是精准的

在语言上,这次Vidu Q3还同时支持中文、英文和日文等多种。

有点意思,着实有点意思。

而且Vidu Q3这次的实力也是得到了国际权威AI基准测试机构Artificial Analysis的认证。

在最新的榜单中,Vidu Q3 排名中国第一,全球第二;与之同台竞技的选手包括马斯克xAI Grok,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora 2。



如此好玩的新AI,老规矩,一波深度实测,走起~

拍剧吗?一张图就够了

首先在操作上,我们在图生视频页面中,需要先选择“Vidu Q3”这个模型,可以一口气出1-4个视频。



在上传首帧图片、输入对应提示词后,我们还可以选择生成视频的秒数,从1秒到16秒都可以。



接下来,我们用图生音视频的方式,一次性生成一段主播连麦对话的视频,首帧和Prompt如下:



请欣赏效果:



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

有一说一,冷不丁一看,还真像是从真实连麦视频录像中截出来的一段恶搞片段。

不仅一次性16秒的音视频可以直出,而且台词和演绎的效果吻合Prompt的要求。

更让人意外的是,Vidu Q3似乎是识别到了直播场景,在Prompt没有提示的情况下,自动让弹幕动了起来。

用类似的方式,我们再来玩个有意思的。

假设有个短剧的场景是这样:一位年轻女性正在综艺节目当导师,点评参赛选手的演技,需要犀利且愤怒的锐评。



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

嗯,这个演技,台词的愤怒和表情是恰到好处地对上了;不说是AI,都可以拿去以假乱真了。

看完现代愤怒的短剧,接下来,我们再来尝试一下苦情的古装电视剧。





视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

AI的演技依旧是相当到位,但更细节的是,像风声、抽泣声,还有抬手、摸脸的音效,都是AI在理解场景后自己补上去的,细节可谓是拉满了。

最后,我上一下难度,测试一下Vidu Q3在16秒内一次性转场、换镜头的丝滑程度。

首帧图片和Prompt如下:



稍等片刻后,我们就得到了这样的结果:



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

同样是有点小惊喜,Vidu Q3在稳稳按照Prompt换场之后,自行补加了背景的闪电,以及仰视恶龙的角度等细节。

由此可见,现在Vidu Q3,不论是视觉效果亦或是理解意图的能力,都已经是几乎可以达到“为剧而生”的程度。

为剧而生,一句话也能直出高清音视频

除了图生音视频之外,Vidu Q3其实用只用自然语言也能做到相似的效果。

同样是支持1-16秒的时长,在文生音视频的界面中,还多出了宽高比的选项,包含16:9、9:16、1:1、4:3和3:4五个比例。

这一次,我们以3D皮克斯风格,只用Prompt的方式生成英文动画片,涵盖镜头切换:

  • 皮克斯3d动画风格。
  • 分镜一(中景/侧面视角):温暖明亮的背景中,传来衣物摩擦的沙沙声,右侧成年人缓缓蹲下,与左侧小男孩平视。他温和地说:“I know you’re disappointed, buddy. I really am sorry.”手势略微比划,镜头侧拍捕捉着两人之间微妙的距离感。
  • 分镜二(大人视角/小男孩特写):镜头转到成年人身后,对准小男孩的脸。他眼神低垂,嘴角微微下撇,肩膀无力地耸着。背景音乐渐弱,只听见他一声极轻的、压抑的吸鼻子声。镜头缓缓推近,背景柔化,将失望与无奈的情绪张力拉满。



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

嗯,整个剧情都是稳稳地按照Prompt指示来展开。

3D皮克斯能拿捏,国产修仙动漫定然也是可以直接复用,类似的分镜,我们只需稍加修改一下场景和台词即可:





视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

由此可见,不同风格短剧、漫剧、影视剧的“迁移学习”、批量生产,在Vidu Q3这里是行得通的。

除此之外,Vidu Q3的文生音视频还有个好玩且实用的用法——渲染文字

因为画面中的文字(建筑、背景等)渲染得好,才能省去后期二次加工所带来的麻烦,真正做到一次性出片。

实测的Prompt可以是这样的:

  • 伴随着紧张的电子鼓点,《黑客帝国》风格的“0”和“1”数字铺满屏幕,瞬间形成“Vidu”的字样。细节丰富,质感饱满,极具视觉冲击力。



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

  • 芭提雅的沙滩边上,面向大海,阳光明媚,背景音乐轻快。海上的天空有一个直升机拉着横幅飞过。横幅上有“快来玩Vidu”的字样。



视频地址:https://mp.weixin.qq.com/s/2jhBB2XdOjxJQ5GnTaM_VA

总而言之,不同比例、不同风格,不论是人物、场景亦或是文字素材,Vidu Q3几乎是能够到影视作品的门槛了。

进击的AI视频生成

最后,让我们跳出具体的案例,把目光投向整个行业的时间轴。

自从AI视频生成走进大众视线以来,毫不夸张地说,它每次的进化都给人带来不小的惊喜;这种震撼感,或许在某种程度上源于一种历史的压缩。

回看人类电影史,从卢米埃尔兄弟1895年放映《火车进站》(默片),到1927年第一部有声电影问世,人类整整走了32年

而在AI视频生成领域,从Sora引爆“默片时代”的视觉震撼,到业界有声视频直出,这段路程仅用了不到9个月

在Sora 2之前,视频生成模型的竞争维度,主要还停留在画面的物理一致性、光影质感以及运动幅度上。

那时候的AI视频,就像是一个画面精美但失语的哑巴,声音往往需要后期单独配音或通过其他工具对口型,割裂感在所难免。

但音视频直出的出现,标志着竞争维度的升维:从单一的视觉生成,进化到了音视频原生的多模态融合。

它证明了在统一的模型架构下,AI不仅能理解物理世界的运动规律,还能理解声音与画面之间微妙的时序关联。这种脑补能力,已经从单纯的生成画面,进化到了导戏。

而Vidu Q3的出现,让这种能力得到了更好地延伸:更长、更稳、更连贯。

尤其是它在16秒时长内能做到一镜到底,可以说是让AI真正具备了完整的叙事能力的短片雏形。

当音视频对齐不再是难题,当多语言表达变得轻而易举,我们有理由相信,AI视频生成的下一个“啊哈 Moment”,或许比我们想象中来得还要快。

毕竟在AI的世界里,一天真的能当一年用。

最后,附上一点小福利

量子位邀请码 LZW2,登陆Vidu.cn注册,即送500积分,快来体验Vidu Q3最新功能!

Vidu Q3体验地址:
https://www.vidu.cn

Vidu API地址:
https://platform.vidu.cn

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
处长把我踢出工作群还标“编外”,隔天求我救急?我:没权限!

处长把我踢出工作群还标“编外”,隔天求我救急?我:没权限!

晓艾故事汇
2026-03-21 15:19:51
别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

牛弹琴123456
2026-03-22 13:59:13
1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

微野谈写作
2026-01-27 06:00:03
杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

千秋文化
2026-03-23 20:09:06
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
公积金新调整!4月1日起,职工可自愿提高缴存比例

公积金新调整!4月1日起,职工可自愿提高缴存比例

另子维爱读史
2026-03-25 22:28:47
顺德女老板,叫板国际巨头,一年卖出5个亿

顺德女老板,叫板国际巨头,一年卖出5个亿

最华人
2026-03-25 12:33:15
4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

小舟谈历史
2026-03-19 17:27:44
第六险来了!一文读懂“长护险”

第六险来了!一文读懂“长护险”

极目新闻
2026-03-26 07:21:00
大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

侃球熊弟
2026-03-26 00:36:57
短短1年,灵活就业者暴增4千万

短短1年,灵活就业者暴增4千万

深度报
2026-03-23 21:47:58
姐弟闹掰?李鑫拒绝录口供,直言这样下去姐弟没得做,李林哭了!

姐弟闹掰?李鑫拒绝录口供,直言这样下去姐弟没得做,李林哭了!

李橑在北漂
2026-03-26 01:56:27
谭瑞松,被判死缓

谭瑞松,被判死缓

新京报政事儿
2026-03-25 17:17:03
致命围堵!7500人强攻哈尔克岛,伊朗生死线告急

致命围堵!7500人强攻哈尔克岛,伊朗生死线告急

孤城落叶
2026-03-25 14:06:37
52年岳飞后人找毛主席求安排工作,主席听完沉默片刻,说了句话让他当场愣住

52年岳飞后人找毛主席求安排工作,主席听完沉默片刻,说了句话让他当场愣住

老杉说历史
2026-03-13 23:00:06
6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

孤酒老巷QA
2026-03-25 20:19:35
姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

懂球帝
2026-03-26 04:09:06
雷军晒成绩:小米SU7、YU7双双第一!

雷军晒成绩:小米SU7、YU7双双第一!

快科技
2026-03-26 13:09:04
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
2026-03-26 14:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12346文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
健康
时尚
手机
军事航空

教育要闻

2027届注意:暑期实习=秋招通行证,错过等一年

转头就晕的耳石症,能开车上班吗?

2026年了,最好看的还是“这件针织”!

手机要闻

三星One UI 9前瞻:小部件更方正、Now Bar动画更丝滑

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版