网易首页 > 网易号 > 正文 申请入驻

当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测

0
分享至

国庆假期Sora 2的横空出世那叫一个吸睛,尤其是客串(Cameo)功能,直接把Sora拉到了“AI版抖音”的高度。

但有一说一,在国内,这个玩法早就已经有了。

我们先上传一张奥特曼的照片,来感受下最近比较火的秒变风格的视频:

  • 奥特曼在房间关上灯,画面瞬间变成漫画风格。



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

这个功能叫做参考生,来自Vidu,模型选择的是Vidu Q2。实际上Vidu 去年9月就在全球首个提出【参考生】视频功能,Vidu Q2已经是其参考生视频的第5个迭代版本了。

而同样的提示词给到Sora 2,它生成的效果是这样的:



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

可以看到,Sora 2并没有get到我们提示词里的“关灯”,而是选择碰了一下门把手,并且视频开头也是较为昏暗。

(虽然语义理解不佳,但Sora 2的优势是音视频可以一锅出。)

而且剧透一个好消息,据说在这个月底,Vidu Q2参考生视频还会迎来重大的更新。

我们已经拿到了内测资格,因此,按照老规矩,一波实测,走起~

Vidu Q2参考生视频 PK Sora2

Vidu Q2的参考生功能,从操作角度来看,一大优势就是可以上传多张图片(参考图可以多达7个),然后一句话让它们直接联动起来,像这样:



对生成视频的结果,我们还可以选择时长、清晰度、宽高比和一次生成视频的数量等:



从这个角度来看,参考生在操作上确实是要比Sora 2要灵活得多。

那么接下来,我们就进一步从不同维度来一场PK。

Round 1:一致性大比拼

毕竟一致性是视频生成领域一直以来的一大痛点,因此第一轮的比拼,咱们就来看看它俩是否能做到前后一致。

有请金牌销售——奥特曼:

  • 奥特曼介绍一下图中的包包。



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

可以看到,Vidu Q2在生成视频的过程中,无论是包包还是人物,全程没有异常的变化。

并且放大图片做对比,包包各处拼接的颜色也是与原图高度相符



同样的Prompt,我们再来“喂”给Sora 2,依旧是让奥特曼来介绍:



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

Sora 2依旧的优势在于奥特曼说着中文介绍着这款包包,但……

最基本的一致性却没有保持住,甚至包包各处的颜色都已经变了样,连包带儿都时而三条时而两条。



整体来看,一致性这块儿,Vidu Q2可以说是完胜了。

Round 2:物理规律遵循

除了一致性之外,另一个考量AI视频生成好坏的因素,就要属遵循物理规律了。

接下来,我们来上一点难度,参考图是这样的:



这张图的难点显而易见,就是考验大模型们是否能精准的按照物理规律,把舞者在镜中各个角度的姿态表现出来。

Vidu Q2请听题:

  • 图中的女子在图中的舞蹈房内,从图片中的动作开始,翩翩起舞,动作流畅一致,镜面反射出舞蹈全景,镜头缓慢环绕捕捉舞蹈细节。



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

毕竟这道题目的难度系数较高,虽然还是有一点细节出错,但Vidu Q2参考生整体的表现还算是不错。

但到了Sora 2这里,“华点”就有点多了。

首先还是老问题,不允许上传包含写实人物的图像;于是,我们便替换成了一张动漫的人物:



结果……动漫人物依旧是无法生成……索性我们就直接用文字Prompt去生成:



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

从最终的结果来看,能看清的人物(包括镜面里)有3位,整体完成度较高;配上了音乐也是比较加分(虽然最后误闯进一位摄影师)。

整体来看,在遵循物理规律方面,两位选手可以说是各有亮点。

Round 3:运镜哪家强?

最后,在一致性和物理规律之后,AI视频生成中运镜的使用,也是非常加分的一点。

这次的参考图是这样的:



运镜方面,我们分了三段Prompt:

  • 0-1s镜头1,头发飘扬,拉开弓,超近特写,背景是黑暗森林闪着奇幻的光,箭射出去。切镜头。
  • 1-6s镜头2,黑暗游拿着弓在黑暗森林里快速跑动跳跃,镜头自由跟随,特写全身自由切换,在树林中穿梭,急速大幅度不断跳跃,闪烁。切镜头。
  • 6-8s镜头3,一个旋转镜头环绕人脸慢动作特写,露出邪魅的笑容。

首先是Vidu Q2的表现:



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

如何?是不是有动漫片段的效果了?

镜头是仅仅跟随人物,从近景到远景再到拉近,可谓是一气呵成。

接下来是Sora 2的表现:



视频地址:https://mp.weixin.qq.com/s/B-WVA1DrFLek8e0JueLSvg

可以明显看到,Sora 2生成的切镜会更多,而Vidu是一镜到底的跟随运镜。

因此,这一轮,两者各有优势,Vidu Q2 参考生更符合日常动漫中镜头运镜语言,Sora 2的不停切镜则渲染了紧张的氛围。

中美视频生成PK,已经来到了Next Level

通过以上几个维度的实测,我们可以清晰地看到当前AI视频生成领域的发展现状 。

在这次Vidu Q2参考生视频与Sora 2的直接PK中,两者几乎打了个平手。

Sora 2在音视频同步输出方面具备优势 ,但在更关乎视频内容核心质量的维度上,Vidu Q2参考生视频展示了其独到的处理能力。

不过有一说一,这场比拼的意义远不止于评判两个模型孰优孰劣,它更揭示了行业未来的走向正逐渐被实际应用的需求所定义 。

AI视频技术能否成功的关键,在于它是否能从一个仅能生成惊艳片段的玩具,转变为一个能无缝融入创作者工作流的生产力工具 。

当下的创作者需要的不仅仅是随机、不可控的创意火花,而是能够精确执行指令、稳定复现角色的可靠伙伴。

这正是一致性等功能所具备的战略价值 。保持角色和场景、道具的一致,是实现AI短剧、AI数字人广告乃至虚拟偶像IP等一系列商业应用的基础 。

如果每一次生成的人物都面目全非,那么任何形式的叙事都无从谈起。Vidu Q2参考生视频在此处的深耕,本质上是在尝试解决AI视频工业化生产的核心难题。

即将技术转化为可规模化、可商业化的稳定产出 。

从这个角度看,构建真正的“AI版抖音”,比拼的也绝非单一的视频生成效果 。这个战场是一个包含了从创意构思到内容生成、再到精细化编辑、分发与商业化的完整生态。



△创作者@陈畅用Vidu Q2参考生制作的短片

在生态方面,Vidu 目前基于产品矩阵构建了主体库共享生态,商业化生态,创作者生态等,核心模型产品驱动的完整生态才是其最大的竞争壁垒。

因此,这场技术竞赛不仅是中美顶级模型之间的一次较量,更应该被视为AI视频生产力革命的序章 。

无论是Sora 2还是Vidu Q2,它们的快速迭代都在推动着技术的成熟和成本的降低 。

One More Thing

正如我们在最开始预告的,Vidu Q2参考生视频要在这个月底有一波重大的更新。

据悉Vidu Q2 参考生不仅能支持专业半专业用户群体的真实需求,同时也能完全满足广告电商、影视动漫短剧、互动娱乐等商业领域客户的更高要求,此外,使用体验也将对C端用户非常友好。

我们可以大胆猜测一波,生数科技Vidu这次是否也要将音频的模态容纳进来呢?

Vidu Q2体验地址:
https://www.vidu.cn/create/character2video

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
远强于核聚变!7万亿太空光伏赛道崛起  这10大龙头提前深度卡位

远强于核聚变!7万亿太空光伏赛道崛起 这10大龙头提前深度卡位

元芳说投资
2026-01-30 06:00:08
四川24岁男孩去世,发现时手里拿手机,嘴唇胸口发黑,母亲曝原因

四川24岁男孩去世,发现时手里拿手机,嘴唇胸口发黑,母亲曝原因

好笑娱乐君每一天
2026-01-31 11:12:42
特朗普再发通牒,普京见了伊朗高官 伊朗:已掌握敌方作战计划

特朗普再发通牒,普京见了伊朗高官 伊朗:已掌握敌方作战计划

环球网资讯
2026-01-31 14:12:53
1天净赚2个亿!订单已排队到2026年,全球暴利又合法的公司

1天净赚2个亿!订单已排队到2026年,全球暴利又合法的公司

揽星辰入梦
2026-01-21 07:04:42
王自如现身公司年会发奖 全员现金多发1.5倍 现场金句频出

王自如现身公司年会发奖 全员现金多发1.5倍 现场金句频出

快科技
2026-01-31 19:11:28
前几天在贾鲁河自杀的26岁女孩是郑州一大医院神经外科护士?

前几天在贾鲁河自杀的26岁女孩是郑州一大医院神经外科护士?

金水路7号站
2026-02-01 08:14:50
赵本山担心的事情发生了!何家是个无底洞,第三代人也来要钱了

赵本山担心的事情发生了!何家是个无底洞,第三代人也来要钱了

琴声飞扬
2026-01-23 09:33:04
具俊跪在大S墓前哭泣,葛斯齐爆他放弃遗产,是因为交不起遗产税

具俊跪在大S墓前哭泣,葛斯齐爆他放弃遗产,是因为交不起遗产税

无人倾听无人倾听
2026-02-01 03:33:39
东契奇赛后摊牌,4队有意詹姆斯!艾顿28+13创2纪录,湖人好消息

东契奇赛后摊牌,4队有意詹姆斯!艾顿28+13创2纪录,湖人好消息

鱼崖大话篮球
2026-01-31 11:00:12
廖锡龙同志生平

廖锡龙同志生平

新京报政事儿
2026-01-30 08:26:37
陈赓和陈锡联看上朱德家的苹果,总去串门,陈奇涵:他俩来偷苹果

陈赓和陈锡联看上朱德家的苹果,总去串门,陈奇涵:他俩来偷苹果

兴趣知识
2026-02-01 07:32:23
双色球第26014期晒票!江苏彩民以22倍票+3696元票冲击亿元巨奖!

双色球第26014期晒票!江苏彩民以22倍票+3696元票冲击亿元巨奖!

小李子体育
2026-02-01 08:59:19
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
全新宝马X7将于2027年发布!网友:终于是旗舰该有的样子了

全新宝马X7将于2027年发布!网友:终于是旗舰该有的样子了

汽车网评
2026-01-31 21:16:12
《太平年》:程昭悦的完美计划,到底败在了哪里?

《太平年》:程昭悦的完美计划,到底败在了哪里?

烟花五月下苏州
2026-01-31 22:09:03
万物皆涨的时代已经来了,接下来所有人都会感受到明显的涨价潮

万物皆涨的时代已经来了,接下来所有人都会感受到明显的涨价潮

流苏晚晴
2026-01-31 17:34:25
离谱!成都蓉城上演摆烂式引援?身着队服已到机场,球迷怨声不断

离谱!成都蓉城上演摆烂式引援?身着队服已到机场,球迷怨声不断

罗掌柜体育
2026-01-31 16:58:27
五五分流为什么分不下去了?背后的真相

五五分流为什么分不下去了?背后的真相

枫冷慕诗
2026-01-24 13:09:19
纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

纪实:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

谈史论天地
2026-01-28 17:20:03
双色球26014期彩票周日2月1日实票10注本文内容仅供分析

双色球26014期彩票周日2月1日实票10注本文内容仅供分析

蓝色海边
2026-02-01 09:55:56
2026-02-01 11:12:49
量子位 incentive-icons
量子位
追踪人工智能动态
12090文章数 176369关注度
往期回顾 全部

头条要闻

牛弹琴:中国太厚道了 被多国严重伤害后选择和解合作

头条要闻

牛弹琴:中国太厚道了 被多国严重伤害后选择和解合作

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

科技要闻

黄仁勋台北“夜宴”:汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

亲子
时尚
艺术
房产
手机

亲子要闻

为什么大多数中国家长无法独立带娃?网友的分享犹如醍醐灌顶

10个瞬间,回顾这一年

艺术要闻

毛岱宗 油画风景写生集

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

手机要闻

小米REDMI K80至尊版手机官宣支持《王者荣耀》144Hz模式

无障碍浏览 进入关怀版