网易首页 > 网易号 > 正文 申请入驻

Vidu Q1:打开 AI 生图的下一扇门

0
分享至

早在 2 年多之前,第一次感受到 AI 生图的震撼时,我用 Midjourney 做了一个篇幅很短的漫画()。在总结做漫画的体会时,我是这么写的:

连贯性很难保证。尤其人脸和动作,想要在连贯画面里保持一致,非常难... ... 在可控性方面,只能用画图再垫图,再画图垫图的笨办法确保想要的内容。

这个一直是 AI 生图的痛点。之前用垫图也就是参考图片的方式,生成的人物差异非常大。比如主角的样子:




甚至这已经是我垫图十几次才得到的结果了。只能勉强让人感知到是同一个人。

而 2 年多过去了,这个世界进化到什么阶段了呢?

我近期用的比较多的是 Vidu。第一次注意到是在 4 月份,有新闻称其在 VBench 模型评测上拿了第一。


真正试用了一下,的确很是喜欢。作为国产大模型,可以输入中文,比起 Midjourney 来也方便不少。

前几天拿到了 Vidu 的朋友送的 Q1 参考生图的内测资格,这次玩得有点停不下来。跟各位分享一下。这个版本应该在你看到文章的 9.9 就正式发布了。

先感受一下,我用刚刚的这个角色侧脸,让 Vidu Q1 生成一个穿着白色条纹 T 恤向右看的图:


忽然穿越到 2 年前的垫图到疯的那个情绪里,现在感动得要哭。

整个看起来就真的很准确。

接下来,就是参考生图更厉害的地方,它可以参考不止一张图。

比如,可以直接让男主站在他的船上。



船的还原度非常好。对比我之前画的内容就发现,我之前是没办法做这样拼接的生成的,除非手动操作。

也可以绘制男主跟鲨鱼搏斗的场景:



我还发现,Vidu 为了让用户更好地完成像这样延续主体的创作,贴心提供了主体库的功能,像画漫画的话,男主就可以存到库里,随时调用。


尝试了一些有意思的多图参考。比如让这两个最知名的老鼠抱在一块。



参考的图片数量可以达到 7 张。比如可以让乔布斯跟他的所有最重要的产品合影。



不过比例略有点不太对。看来模型还需要更聪明一些。

既然参考生图的效果这么好,那就可以用现成的场景,让我们直接穿越进去。

我今年夏天跟妻子去北极走了一个祝福仪式。本来很像去光之教堂的,可惜多年前就关闭了。

用参考生图就可以解馋体验一下。



还可以让我出现在喜欢的电影场景里。比如《疯狂的麦克斯 4》里:



或者去《权力的游戏》里让小龙女和马王跟我合张影。看得我还是有点发怵。



再比如,也可以去《血源诅咒》里受苦。



或者去跟马斯克录播客,看他喷云吐雾。



那么,Vidu Q1 这样的参考生图功能除了好玩,到底有没有实际用途?首先玩也是实际用途。其次,当然还有别的用途。

由于参考的效果很好,电商场景就可以用来做带货展示图。

比如,让米老鼠坐在这张椅子上。温馨提示,黑白的米老鼠才是没有版权的哦。



自然也可以让人物坐在这张椅子上:



坐椅子看起来并不难,喝饮料也是可以的。注意看蜜雪冰城的 logo 几乎没怎么变样,这点对于品牌商家来说太重要了。



像这是我之前合伙创业做的茶品牌三五杯,可以让图 1 里的女生捧着它展示。展示角度发生了变化,盒子居然没有什么变形,完美复现。除了文字还是需要简单 p 一下才能用。



也可以让同一个女生展示我的新书《内容即品牌》。



换一个随机生成的棒球女生,效果也很不错。



某些产品未必需要人,可能需要的是场景化的展示。

比如一个竹凳,就可以放到有竹子的潺潺小溪中展示。



当然,也可以非常混搭,既有人物,又有竹凳。背景再放飞一些,放到外太空,也是可以的。



电商场景里还有一个至关重要的痛点,就是试衣。说 AI 试衣已经说了很多年了。我也是第一次感知到,AI 试衣真的能帮到我。

比如这两个就是非常糟心辣眼睛的例子。

一个是中国风西装。



一个是英伦绅士风。



尝试了一下,衣服的适配度跟颜值还是息息相关的。颜值高的,穿什么都好看一些。颜值像我这样的,需要谨慎筛选、仔细斟酌。

像同一件衣服,用刚刚的女生形象,生成的效果就很棒。



既然可以试一件衣服,那是不是也能试好几件衣服?

当然也是可以的。选了一件非常暴力美学的衬衫、半拿铁的帽子以及相当宽松的裤子。



我还挺喜欢这套的,于是也让其他几位朋友试了试。



以上就是我试用的阶段性体验。

电商和广告是我相对熟悉的,第一时间能想到应用场景的领域。

而生图乃至生视频的一致性、对参考图的精准控制问题解决后,将会影响几乎所有跟图像有关的行业。

比如,漫画转制动画方面,原本的分镜内容就像是关键帧,可以快速生成很多角度和动作的补帧,能自然地把剧情连贯起来。就不需要担心动画画师偷懒,把人物给画毁掉(比如某小学生侦探动画)。

再比如,影视行业里的概念设计,基于已有的人物和场景,就能不断生成大量的风格统一的概念图,作为参考。并且由 AI 产生的各种可能性,也是一种低成本的头脑风暴,大大提升效率。

再比如,品牌的 VI 系统,也可以由基础的元素,快速实现平面设计,包括广告图、海报、帖子配图、包装图等等。

能联想到的还有很多。各位工作中有接触设计工作的朋友,尤其是上次接触 AI 生图还是一两年前的,真心推荐体验一下。

在众多有参考生图的 AI 工具里,我个人还是倾向各位尝试下 Vidu Q1。

有这么几点原因:

1 参考图片数量足够多,达到 7 张。很多元素都可以参加进去。而多数竞品还是只支持 1-3 张参考图片。

2 主体一致性够强,不会出现太多细节走样。就像前面说的,在广告营销领域,是能够成为生产力的。拿来即用,很重要。

3 可控性好。输入的提示词对图片生成的效果会产生非常具体的影响。而且就像前面说的,中文输入的门槛更低。图片是提示词的必选元素,因此图片中内容的关系是指定的、可控的。

最后,用这样一张图作为结尾吧。我要去冥想一会儿了。



点击原文也可以直接跳转到 Vidu 官网申请使用。

*本文中没提到名字的人物形象,均为 AI 生成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
罗晋行程曝光!结婚7年很少回家,半年提6次分手,爱与不爱很明显

罗晋行程曝光!结婚7年很少回家,半年提6次分手,爱与不爱很明显

书雁飞史oh
2025-11-19 20:20:32
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
长城魏建军,又放了一炮!整个行业被炸懵

长城魏建军,又放了一炮!整个行业被炸懵

象视汽车
2025-11-18 07:00:02
广东一夜3消息!萨林杰正式到队,杜锋徐昕和好,新双外首次合训

广东一夜3消息!萨林杰正式到队,杜锋徐昕和好,新双外首次合训

多特体育说
2025-11-19 22:40:09
民国时期的一块大洋,折算成现在的人民币,大概是多少钱?

民国时期的一块大洋,折算成现在的人民币,大概是多少钱?

沈言论
2025-11-18 22:05:03
儿大当立,詹姆斯:布朗尼已经搬出去住了,我俩现在联系不多

儿大当立,詹姆斯:布朗尼已经搬出去住了,我俩现在联系不多

懂球帝
2025-11-19 16:39:05
广东宏远功勋老臣离队,考上编制任广工新主帅,杜锋不舍

广东宏远功勋老臣离队,考上编制任广工新主帅,杜锋不舍

梦回千年aa
2025-11-18 19:38:34
烟台一渣土车侧翻压死女老师,遇难者家属讲述: 学生纷纷悼念,肇事车经改装严重超载

烟台一渣土车侧翻压死女老师,遇难者家属讲述: 学生纷纷悼念,肇事车经改装严重超载

潇湘晨报
2025-11-19 20:32:25
11连胜东部第一!活塞拒老鹰19分逆转 坎宁安复出25+6+10

11连胜东部第一!活塞拒老鹰19分逆转 坎宁安复出25+6+10

醉卧浮生
2025-11-19 11:01:30
演都不演了!王曼昱官宣退赛不到24小时,恶心的一幕出现了

演都不演了!王曼昱官宣退赛不到24小时,恶心的一幕出现了

古木之草记
2025-11-19 18:10:55
已确。认!是周润发

已确。认!是周润发

失宠的小野猪
2025-11-19 23:29:22
过继到舅舅家后,杨志刚被从医大哥、经商二哥、导演三哥宠上天

过继到舅舅家后,杨志刚被从医大哥、经商二哥、导演三哥宠上天

书咚咚
2025-11-17 20:50:29
国际模特大赛广东总冠军小姐曝光,广东网友纷纷向全国人民道歉

国际模特大赛广东总冠军小姐曝光,广东网友纷纷向全国人民道歉

七月生活情感驿站
2025-11-19 13:38:10
女友被车撞伤抢救无效死亡,男友未报警未打120自行离开 家属索赔31万,一审判了

女友被车撞伤抢救无效死亡,男友未报警未打120自行离开 家属索赔31万,一审判了

红星新闻
2025-11-19 21:35:11
家中发现这种“黑盒子”,快报警!多地已发现

家中发现这种“黑盒子”,快报警!多地已发现

环球网资讯
2025-11-19 16:13:06
舆论可能是假,但销量从不说谎,最近的手机榜有意思

舆论可能是假,但销量从不说谎,最近的手机榜有意思

互联网.乱侃秀
2025-11-17 10:09:24
是时候说出真相!抗美援朝有五个冷知识很少提及,超乎我们的想象

是时候说出真相!抗美援朝有五个冷知识很少提及,超乎我们的想象

阿光的技巧课堂
2025-11-11 19:56:12
高建民同志逝世,中央有关领导同志以不同方式表示哀悼

高建民同志逝世,中央有关领导同志以不同方式表示哀悼

新京报
2025-11-19 19:41:30
什么情况?张子宇无缘新赛季WCBA 媒体人曾曝与山东存在较大分歧

什么情况?张子宇无缘新赛季WCBA 媒体人曾曝与山东存在较大分歧

狼叔评论
2025-11-19 19:14:05
皇马小将:梅西还是C罗?我虽忠诚皇马,但梅西是第一人!

皇马小将:梅西还是C罗?我虽忠诚皇马,但梅西是第一人!

氧气是个地铁
2025-11-19 22:38:18
2025-11-20 00:07:00
后厂村的刘飞 incentive-icons
后厂村的刘飞
产品经理
48文章数 73关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

手机
数码
房产
公开课
军事航空

手机要闻

OPPO Find X10浮出水面:天马LTPO 3.0 Pro加持,性能也没悬念

数码要闻

华为MatePad Edge现场体验丨鸿蒙二合一平板电脑

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版