网易首页 > 网易号 > 正文 申请入驻

Vidu Q1参考生图硬刚Google Nano Banana,7图参考实现“一致性”突破

0
分享至


AI生图领域,终于迎来中国力量的高光时刻。

在Google发布Nano Banana仅10天后,生数科技旗下视频大模型Vidu于9月9日正式推出Vidu Q1参考生图功能,以支持7张参考图输入打破国内生成上限,并在一致性、还原度等关键指标上全面超越Flux.1 Kontext,正面对标Nano Banana。


这意味着,一直由国际巨头主导的AI生图赛道,首次出现了具备差异化竞争力、甚至局部实现超越的中国创业公司。Vidu Q1参考生图的发布,不仅是一次技术迭代,更是一场围绕AI生图领域的国产逆袭。

此次Vidu 发布的Q1参考生图主要有五大亮点:

Vidu Q1参考生图以“参考够多,还原够真”为核心,主要包括五大亮点:

1.参考数量行业领先,同时支持7张参考图输入,可控性强。

2.主体一致性更强,在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。

3.高还原度,真实感更强,在保持参考图特征的同时,还原度高,更贴近用户原始输入,真正做到“所见即所得”。

4.创作自由度极高,一张图 + 一句提示词,就能自由换装、换背景、自由合成。支持多人同场景或者多人多场景,满足复杂剧情、合影、多角色电商等场景。

5.支持1080P高清分辨率,中文语义理解更强

一、对标谷歌Nano Banana,国产AI生图迎来突破

通过多组案例对比可清晰看出,Vidu Q1参考生图在生成一致性方面显著优于Flux.1 Kontext,并在部分场景中媲美甚至超越Nano Banana:

在人物拿着电饭煲的案例中,Nano Banana frequently 出现物体悬空、摆放不合理的问题,生成的饭碗并未放置到合理位置,而Vidu生成结果自然合理,符合物理规律;

案例1:


生成结果对比:


在案例2中,Kontext容易出现眼镜丢失、背景错乱、人脸不一致等问题,Nano Banan 服饰变成了白色连衣裙,同时耳环也与原图不一样。在此案例中,Vidu 则能精准还原每一处细节,同时保持人脸、服饰、道具、场景都与原图一致。



再来比较下各家AI生图对于细节的还原度。

在案例3中,Nano Banana的人物左眼双眼皮消失,Midjourney人物凭空多了副眼镜,即梦的人物发型和卫衣服装都发生了变化,Kontext脸上多了很多斑点。Vidu则在人物脸部细节特征和服饰细节特征上都做到了非常准确地还原。


输出结果:


在局部补全、物体延展等需要强推理能力的任务中,Vidu也表现出更强的语义理解和画面延伸能力。

以下面的双彩虹照片为例,要求补全另外半边彩虹。

案例4:


生成结果对比:


在上图的例子中,Nano Banana 并没有理解提示词中补全彩虹的意思,彩虹只出现了另外半边,而Vidu Q1参考生图则做到了将没有出现在图片中的另外半边彩虹补全,形成了完整挂在天上的双彩虹景象,表现出了极高的画面理解能力和一致性。

从第三方评测机构来看,Vidu在AI参考生图的一致性指标上超过了谷歌的Nano Banana 和Kontext ,位居第一。


在一致性、真实性、清晰度、美学、语义理解等综合指标评分中位居第二,仅次于谷歌Nano Banana。


值得一提的是,在能力全面对标Nano Banana 的同时,Vidu Q1参考生图对国内用户也更为友好,无需翻墙,操作更为简单,对于中文理解更强。相对于Nano Banna无法指定输出图片比例,Vidu 可支持多种比例图片输出,同时Vidu Q1参考生图支持1080P高清像素,更适合商用场景。

二、三大模式全覆盖:合成、替换、变换解锁行业创新应用

除了过硬的一致性,Vidu Q1参考生图还支持“合成+替换+变换”三大模式,可覆盖电商、广告、动漫、影视、设计等多行业场景。

万物皆可合成

Vidu Q1 参考生图支持让不同人物同框或者将某个人物或者商品放入具体场景中,让想象中的画面成真,让不可能成为可能。

1、复杂场景合成

通过指定某主体在某个场景中做什么,可以生成高大上的杂志封面、商品海报、动漫短剧分镜。

比如你可以用Vidu Q1 参考生图制作时尚杂志封面。

案例5:


画面中每个主体精准还原,背景换成室内有光线的房间后,男士和羊的光影也随之变化,画面十分逼真。

中秋节来临,Vidu Q1参考生图也能成为电商、设计师们的提效神器。

案例6:


Vidu Q1参考生图还可用于创意营销的产品素材,比如让林黛玉代言川贝枇杷膏。产品包装的细节、颜色、质感都与原图保持完全一致,古代人物与现代商品间的互动,有种穿越古今的反差感。

案例7:


2、人物、商品同框场景

利用Vidu Q1参考生图功能,即可和你喜欢的明星同框。

比如输入你和明星的照片和大头贴框,即可生成你和泰勒斯威夫特在海边的合影照,融合自然,仿佛是在某个海边拍的偶遇照片。

案例8:


3、服装流行元素合成

Vidu Q1参考生图在服装设计领域也有广泛的应用场景。

用Vidu Q1参考生图把裙子换上今年夏天最时髦的碎花花纹,变身最潮达人。

案例9:


万物皆可替

Vidu Q1参考图中的人物、道具、场景都可以随意替换,不仅可玩性高,而且也大幅提高创意资产复用率,不到半小时即可批量产出实用产品宣传素材、海报大片。

1、场景替换

十一假期来临,利用Vidu Q1参考生图,帮助用户解锁热门旅游地,再也不用”人从众”中各种找角度拍照,也无需等待黄金拍照时间,即可快速生成完美旅游打卡照。

比如下图案例,遗憾错过日照金山,直接用Vidu Q1参考生图将背景换成日照金山的背景,即刻生成人生照片。

案例10:


品牌方也可以通过替换不同的背景,打造更多样化的使用场景,传递不同的品牌调性,促进销售转化。

比如将图一的蓝色便携音响换成户外森林和岩石的背景,适配不同的季节,体现别具一格的生活品味。

案例11:


2、道具替换

同样的背景,通过道具替换,可产出一系列产品素材图,适用于TO C 玩法以及产品上新场景。

比如利用Vidu Q1 参考生图将超现实主义画家雷尼·马格利特的名画《人类之子》的经典绿苹果替换成茄子、拖鞋、南瓜,生成一系列趣味组图。

案例12:


3、主体替换

还可以通过主体替换的方式实现影视剧、海报的角色替换。

仍然以上图为例 ,将《人类之子》中的男人换成黄仁勋,保持背景不变。可以看到黄仁勋戴着《人类之子》中的帽子,穿着标志性的皮夹克,视野部分被绿色苹果遮住,完美复刻经典艺术画。

案例13:


4、AI虚拟换装

《穿Prada 的女魔头2》正在紧锣密鼓拍摄中,曾经《穿Prada的女魔头》中的女主角安妮.海瑟薇在一天的拍摄中就需要换4套服装,换装速度之频繁令人印象深刻。而现在利用Vidu Q1参考生图,服装模特不到5分钟就可实现迅速换装,对于消费者来说,也可以通过AI换装直观感受试穿效果。

让模特在银白色现代化的室内房间中,分别换上西服、晚礼服、紧身装、休闲运动装,效果非常出片。

案例14:


Vidu Q1参考生图也支持同时换装+换场景。比如用AI生成霉霉的结婚现场照。

案例15:


万物皆可变:

Vidu Q1参考生图不仅仅能实现替换、合成,而且还可实现线稿转3D、照片转手办、转冰箱贴、线稿上色、老照片修复等酷炫功能。

1、线稿转3D

Vidu Q1参考生图能将复杂的建筑设计图,直接转化为3D立体模型图,建筑细节精准还原,省去复杂的建模流程。


2、线稿上色

通过指定建筑物替换成木头材质,并为周围的景观涂色,生成一张上色后的建筑效果图。


3、变成冰箱贴

Vidu Q1参考生还可以一张普通的平面照片直接变成立体冰箱贴,真实得如商场售卖的纪念品。


4、变身手办

当然最近很火的手办玩法,Vidu Q1参考生图也能稳定发挥,不仅支持二次元转手办,还可以让真人直接变成桌面手办,与真人简直神同步。


5、局部放大/缩小

以上述《人类之子》的图片为例,通过提示词图片中的南瓜分别变大1倍、1.5倍。输出图:


6、特效画面

Vidu 还支持用户解锁特效玩法,让动漫人物自带特效。


结合Vidu Q1首尾帧功能,短发女生后面的金色光环自动旋转了起来,效果惊艳,仿佛在召唤某种神秘魔法。

三、从追赶到超越,AI创业公司的进阶之路

作为Vidu首款参考生图产品,Vidu Q1一经推出便实现对谷歌Nano Banana的全面对标,在AI生图这一巨头云集的赛道中展现出中国创业公司的硬核技术实力。

Vidu Q1参考生图的发布,是中国AI多模态领域的一次重要突破。它证明了中国团队不仅能够紧跟国际发展,更能在关键技术上实现差异化创新甚至局部超越。在AI生图走向“生产级”应用的关键节点,Vidu终于为中国公司争得了一席之地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从身价千万到负债960万,如今连500块都借不到,人到中年不如狗

从身价千万到负债960万,如今连500块都借不到,人到中年不如狗

公子麦少
2025-08-31 14:15:24
二战前一幕再次上演?北约4万大军压境,普京在关键时刻等来外援

二战前一幕再次上演?北约4万大军压境,普京在关键时刻等来外援

坐景观天
2025-09-17 00:39:13
保险业务员发现:买车损险的人越来越少,人们有了一举两得的办法

保险业务员发现:买车损险的人越来越少,人们有了一举两得的办法

李子橱
2025-09-16 16:38:59
罗永浩让西贝的军师华与华私下道歉,华杉言论被翻出,遭大量惨骂

罗永浩让西贝的军师华与华私下道歉,华杉言论被翻出,遭大量惨骂

星河也灿烂
2025-09-15 11:56:11
若被证实阴阳合同!小卡和快船合同可能被取消 管理层或被禁赛

若被证实阴阳合同!小卡和快船合同可能被取消 管理层或被禁赛

直播吧
2025-09-17 01:44:25
入住三年才发现:家里做好“这6处”收纳,才是锦上添花!

入住三年才发现:家里做好“这6处”收纳,才是锦上添花!

家居美少女
2025-09-05 16:52:35
26万难民逃到中国“赖着”不走,还想入中国籍:做梦都想当中国人

26万难民逃到中国“赖着”不走,还想入中国籍:做梦都想当中国人

近史博览
2025-08-19 11:01:20
傅斯年:人间一个稀有的天才

傅斯年:人间一个稀有的天才

尚曦读史
2025-09-14 10:56:13
微信重大功能上线,网友:终于可以发了

微信重大功能上线,网友:终于可以发了

掌上春城
2025-09-16 22:35:30
清朝灭亡后,李莲英姐姐才敢说出实情:慈禧其实不是病死的!

清朝灭亡后,李莲英姐姐才敢说出实情:慈禧其实不是病死的!

蜉蝣说
2025-09-16 11:23:23
1959年彭总落难之后,有9位将军雪中送炭,他们分别是谁?

1959年彭总落难之后,有9位将军雪中送炭,他们分别是谁?

言今忆史
2025-09-03 10:04:12
醍醐灌顶——中国最著名的四篇演讲

醍醐灌顶——中国最著名的四篇演讲

尚曦读史
2025-07-17 21:28:51
石平家庭状况曝光!父母以他为耻,俩妻子都离婚,妹妹公开骂他

石平家庭状况曝光!父母以他为耻,俩妻子都离婚,妹妹公开骂他

谈史论天地
2025-09-12 16:24:31
印度网友:中国只有5%的家庭有电?美国网友:中国通电率是100%!

印度网友:中国只有5%的家庭有电?美国网友:中国通电率是100%!

诗意世界
2025-09-10 23:20:49
冯唐:享受了祖上的红利,却和别人谈“靠努力”,这是最大的无耻

冯唐:享受了祖上的红利,却和别人谈“靠努力”,这是最大的无耻

清风拂心
2025-09-01 16:15:03
以色列捏错了柿子,卡塔尔影响力非常大,或将采购中式防空系统

以色列捏错了柿子,卡塔尔影响力非常大,或将采购中式防空系统

青途历史
2025-09-15 21:31:00
即将通车!东莞市区20分钟直达广州南!1小时内白云机场!

即将通车!东莞市区20分钟直达广州南!1小时内白云机场!

我们的东莞
2025-09-16 18:13:12
买纯电保时捷的中产们,这次又要为无线充电桩买单了?

买纯电保时捷的中产们,这次又要为无线充电桩买单了?

差评XPIN
2025-09-16 00:10:45
发明汉芯的陈进,从国家骗取11个亿后逃往美国,后来怎样了

发明汉芯的陈进,从国家骗取11个亿后逃往美国,后来怎样了

老黄有话
2024-09-03 08:00:03
西贝军师丨全国第一的品牌营销咨询公司:华与华,到底是谁?

西贝军师丨全国第一的品牌营销咨询公司:华与华,到底是谁?

小鹏财经
2025-09-16 15:54:07
2025-09-17 02:07:00
猎云网
猎云网
聚焦科技创业创新,钻研产业趋势,用心服务创业者。
57532文章数 327043关注度
往期回顾 全部

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

清华学霸小红书晒1.67亿元年薪被查 美司法部:他在逃

头条要闻

清华学霸小红书晒1.67亿元年薪被查 美司法部:他在逃

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

房产
健康
艺术
亲子
手机

房产要闻

当海口书包房卷向「未来」,这里的孩子和房价,都在高速超车!

内分泌科专家破解身高八大谣言

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

亲子要闻

商务部等九部门:支持有条件的幼儿园招收2—3岁幼儿

手机要闻

华为鸿蒙 HarmonyOS 6.0.0.100 开发者 / 用户尝鲜版本开启推送

无障碍浏览 进入关怀版