网易首页 > 网易号 > 正文 申请入驻

阿里千问Z-Image实测来了!不输Banana,开源王者?

0
分享至

原本,小雷以为今年下半年AI圈子的热闹,也就是那样了。

闭源这边,由Gemini 3 Pro驱动的Nano-Banana Pro,几乎改变了大家对于平面设计的认知;开源这边,Flux 2.0的突然开源,也让普通人能够自行部署的图像生成效果大大提升,只要优化做得好,人人都能跑出像模像样的图。

那时候同事还跟我打赌,说这两款大模型的风潮,最起码能领跑个半年。

结果没想到,打脸来得这么快。

就在这两天,阿里的通义千问团队突然甩出了一张王炸——Z-image,上线即登顶开源社区热门榜第一位。



(图源:Hugging Face)

这名字听着挺硬核,但真正吓人的是它的定位:一款60亿参数(6B)的开源图像生成模型。

这消息一出来,我和同事都在群里炸锅了。要知道,在现在的生图领域,6B这个参数量,基本就是个弟弟。隔壁那些动不动几十B甚至上百B的大模型,光是权重文件下载下来都能把硬盘塞满。

阿里这是要干嘛?拿个“弟弟”来跟一群肌肉猛男打擂台?

带着这种好奇,小雷第一时间去把Z-image给拖了下来,还特意找来了两个当红炸子鸡——字节的豆包和最近红得发紫的Nano-Banana Pro,看看这仨的差距到底在哪?

千问Z-image体积小,部署门槛超低

先别急着看图,咱们得先聊聊这个Z-image到底是个什么来头,以及如果你想玩,得准备点啥。

按照官方介绍,Z-Image(中文名“造相”)是阿里巴巴通义实验室研发并开源的高效图像生成基础模型,定位为“轻量且高性能”的AI图像解决方案,对标参数量20B以上的闭源旗舰模型。

而这款产品本身,参数量只有6B。

在AI界,参数量大概可以理解为模型的“脑容量”。一般来说,脑容量越大,懂的知识越多,画出来的细节越丰富,而Nano-Banana Pro之所以文生图的效果极为出色,很大一部分原因就在于谷歌训练出来的极高参数量。

但代价就是,你得有个好显卡伺候着。

以最近开源的Flux 2为例,32B的参数量,你不掏个24GB显存的3090/4090,基本连启动这一关都过不去。



(图源:Flux 2)

但Z-image这个6B就很灵性了。

小雷看了一下官方文档,它的硬件门槛简直低得让人感动。哪怕你是好几年前的 RTX 3060,或者是随便整一张显存6GB的消费级主流显卡,配合上现在成熟的量化技术,也能跑得飞起。

这就意味着,你不用为了玩个AI画图,还得专门去配台主机。你手边那台用来打LOL的游戏本,甚至是一些高性能的轻薄本,都能变成你的创意工坊。

要把这个东西跑起来,其实很简单。

讲究一点的,你可以去Hugging Face下载模型,搭配上tonyhub这类简洁前端和一条工具流就能用。

不太讲究的,只要下载ComfyUI最新版,或者是升级一下本地版,就直接可以使用了,都不需要安装第三方节点。工作流已经内置了,只需要打开模板,点击Z-image-Turbo即可,接下来按照官方提示下载、放置模型就OK了。



(图源:ComfyUI)

当然,如果你说小雷我连显卡都没有,是核显用户怎么办?

也没事,现在像这种开源模型,Hugging Face和阿里的魔搭社区(ModelScope)上通常都有现成的在线Demo。虽然排队可能要等一会儿,但胜在白嫖,不用白不用嘛。

实战表现:体积小却很精悍

不过,光说不练假把式。参数小了,效果是不是也跟着缩水了?

为了验证这点,我也做了一些测试,用相同的Prompt,看看它和目前国内外常用的两家图片生成大模型的对比。

先看几个纯粹的生图效果。

Prompt:人类考古学家在金字塔挖掘现场发现一个旋转金属球的真实手持拍摄,手持纪录片现实主义,真实手持风格。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,只有Nano-Banana Pro能够还原出纪录片拍摄的界面和质感。

至于Z-image和豆包,他俩在这张图片上的表现其实相差无几,但是Z-image图片的一致性则明显有点偏高,多次反复尝试,在相同参数下得出来的结果都是极为相似的,根据网友分析,可能是内置参数带来的影响。



(图源:Z-image)

再来一张人像,试试三家的成色。

Prompt:一张平平无奇的iPhone照片,无精心构图和打光,日常快拍,松弛氛围感亚洲美女,穿着宽松厚毛衣与牛仔阔腿裤,舒适随性。她随意站在街头或咖啡馆门口,肩上自然背着一只单肩包,款式简洁低调,增添生活气息。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,三张图片都没有什么问题,都可以做到真实感强,光影自然,画面里头也不存在明显的呲漏。

要真说有啥不同,明显Z-image和豆包更符合国人审美,而Nano-Banana Pro生成的华人有明显的ABC特征。

接下来,我们试一下简单的海报设计,Prompt太长就不在这里列举了:







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图很有意思,可以看出,在更新迭代后,Nano-Banana Pro应对一般的中文嵌入已经没啥问题了。

论细节和光影的话,这我觉得大家都在伯仲之间。

既然单格图片问题不大,那么多格图片教程又如何呢?

Prompt:手账风格,出一个番茄炒蛋的制作步骤教程图,步骤说明要中文,落款是##。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图差距就很明显了,我们不难看出,只有Nano-Banana Pro能够掌握多格图片的生成和数字顺序的含义,基本上一次出图。

Z-image这边,粗看是有那么点意思,但是数字标注完全是错的。

最后,让我们看看二次元/漫画图片的生成。

Prompt:日本漫画风格,初音未来和洛天依撕开一张海报并穿越到现实中,酷炫的彩铅作画,动态多彩的画面。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这一对比,差距马上就出来了,只有Nano-Banana Pro知道两位角色,构图也很有意思,豆包虽然没有洛天依的概念,但是起码还有个构图的优势,Z-Image就是根本不知道在干些什么了。

只能说,在知识量这块,Z-Image确实还是比不上闭源模型。

至于图生图,或者图片编辑之类的能力,目前开源的Z-Image-Turbo是没有的,咱们还是等等Z-Image-Edit吧。

评测总结:堪称图片AIGC开源界扛把子?

测完这几轮,小雷心里的评价大概有了谱。

Z-image强吗?强。

在中文语境的理解、在单张图片的审美、以及最重要的——在硬件资源的利用率上,它简直是当下开源界的T0级别。

虽然在复杂推理和精准编辑上,它还打不过Nano-Banana Pro这样的闭源大佬,目前也缺失了图片编辑相关的能力,但在90%的日常使用场景里,它已经能做到“够用”甚至“好用”。

这对于那些想尝试AIGC的中小企业,或者是像我们这种想在本地搞搞创作的个人用户来说,意义太大了。

而且别忘了,它是开源的。

这意味着什么?意味着明天可能就会有大神在它的基础上,训练出专门画二次元的、专门画建筑设计的、专门做电商海报的各种微调模型。



(图源:Reddit)

就像当年的安卓手机一样,一开始可能不如苹果流畅,但架不住玩的人多、改的人多,生态一旦起来了,那爆发力是惊人的。

所以,如果你问小雷:Z-image值得折腾吗?

我的回答是:只要你有张显卡,哪怕是入门级的,都值得下下来玩玩。

毕竟,不用花钱,不用买昂贵的算力,就能在自己硬盘里养一个随叫随到的画手,这种把技术握在自己手里的感觉,可是那些在线生成平台给不了的。

而且按照阿里这个“卷”法,我有预感,明年这个时候,我们可能就能在手机上跑这种级别的模型了。

到时候,人人都是神笔马良的时代,可能真的就不远了。

CES2026开幕在即!(1月6日-1月9日)
作为中国报道科技展会最悠久、最深入、最专业的新媒体,雷科技CES2026报道团正在进行紧张的前期筹备。届时雷科技将派出史上最大规模的CES报道团,并由雷科技创始人兼总编辑罗超带队,对CES2026进行一线、专业和立体报道,敬请期待!



声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

阿龙美食记
2026-02-28 10:49:43
美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

军机Talk
2026-03-25 17:17:57
防爆气象站设备:防爆生产知识科普

防爆气象站设备:防爆生产知识科普

柏峰气象环境监测站
2026-03-26 08:35:06
盘点现役出道十年以上的岛国启蒙老师,陪你度过多少夜晚?

盘点现役出道十年以上的岛国启蒙老师,陪你度过多少夜晚?

吃瓜党二号头目
2026-03-26 14:55:08
微信出现这条杠,你已经不是对方好友了

微信出现这条杠,你已经不是对方好友了

王二哥老搞笑
2026-03-21 07:36:51
阚清子产后现身机场!手上鸽子蛋大钻戒抢镜,富豪老公拎包似保姆

阚清子产后现身机场!手上鸽子蛋大钻戒抢镜,富豪老公拎包似保姆

老好人的愤怒
2026-03-26 18:02:04
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
伊朗称美以袭击伊斯法罕理工大学校内建筑

伊朗称美以袭击伊斯法罕理工大学校内建筑

财联社
2026-03-26 17:58:06
过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

谈史论天地
2026-03-26 07:56:52
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
特朗普万万没想到!第一个敢掀桌子的,竟然是马来西亚

特朗普万万没想到!第一个敢掀桌子的,竟然是马来西亚

黑鹰观军事
2026-03-25 17:12:13
看看伊朗东北方都是哪些国家,就知道伊朗为何如此淡定了

看看伊朗东北方都是哪些国家,就知道伊朗为何如此淡定了

孤云朗境
2026-03-06 20:43:36
日媒:巴基斯坦正成为美伊冲突主要调解方

日媒:巴基斯坦正成为美伊冲突主要调解方

参考消息
2026-03-25 15:23:26
NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

铁甲西奇
2026-03-26 16:43:09
中美情况有变,特朗普民调崩了,奥托尔巴耶夫出山,美国衰落已定

中美情况有变,特朗普民调崩了,奥托尔巴耶夫出山,美国衰落已定

一口娱乐
2026-03-26 18:11:38
大众中国回应斯柯达退出中国市场

大众中国回应斯柯达退出中国市场

澎湃新闻
2026-03-26 17:33:03
缺钱了?景甜卖上海黄浦江200平的大平层,价格在1.35亿元

缺钱了?景甜卖上海黄浦江200平的大平层,价格在1.35亿元

椰黄娱乐
2026-03-24 11:36:57
电动车逆行被撞身亡,家属索赔120万,法院判司机担责40%引热议!

电动车逆行被撞身亡,家属索赔120万,法院判司机担责40%引热议!

渔夫说事
2026-03-25 16:35:06
伊朗伊斯兰革命卫队海军指挥官遇袭身亡

伊朗伊斯兰革命卫队海军指挥官遇袭身亡

北青网-北京青年报
2026-03-26 17:43:04
不装了!冯德莱恩承认:拒绝俄天然气很痛苦,欧盟被迫一夜间放弃

不装了!冯德莱恩承认:拒绝俄天然气很痛苦,欧盟被迫一夜间放弃

万国明信片
2026-03-25 16:16:12
2026-03-26 21:20:49
雷科技 incentive-icons
雷科技
专注AI硬科技
36605文章数 811953关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
时尚
亲子
本地
军事航空

教育要闻

来上课了——高考阅读难题大综合(细节+主旨+含义)(下)第1段

上新|| 她们说,找到了自己的人生裙子!

亲子要闻

孩子模仿这种行为,容易被坏人盯上!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版