网易首页 > 网易号 > 正文 申请入驻

阿里千问Z-Image实测来了!不输Banana,开源王者?

0
分享至

原本,小雷以为今年下半年AI圈子的热闹,也就是那样了。

闭源这边,由Gemini 3 Pro驱动的Nano-Banana Pro,几乎改变了大家对于平面设计的认知;开源这边,Flux 2.0的突然开源,也让普通人能够自行部署的图像生成效果大大提升,只要优化做得好,人人都能跑出像模像样的图。

那时候同事还跟我打赌,说这两款大模型的风潮,最起码能领跑个半年。

结果没想到,打脸来得这么快。

就在这两天,阿里的通义千问团队突然甩出了一张王炸——Z-image,上线即登顶开源社区热门榜第一位。



(图源:Hugging Face)

这名字听着挺硬核,但真正吓人的是它的定位:一款60亿参数(6B)的开源图像生成模型。

这消息一出来,我和同事都在群里炸锅了。要知道,在现在的生图领域,6B这个参数量,基本就是个弟弟。隔壁那些动不动几十B甚至上百B的大模型,光是权重文件下载下来都能把硬盘塞满。

阿里这是要干嘛?拿个“弟弟”来跟一群肌肉猛男打擂台?

带着这种好奇,小雷第一时间去把Z-image给拖了下来,还特意找来了两个当红炸子鸡——字节的豆包和最近红得发紫的Nano-Banana Pro,看看这仨的差距到底在哪?

千问Z-image体积小,部署门槛超低

先别急着看图,咱们得先聊聊这个Z-image到底是个什么来头,以及如果你想玩,得准备点啥。

按照官方介绍,Z-Image(中文名“造相”)是阿里巴巴通义实验室研发并开源的高效图像生成基础模型,定位为“轻量且高性能”的AI图像解决方案,对标参数量20B以上的闭源旗舰模型。

而这款产品本身,参数量只有6B。

在AI界,参数量大概可以理解为模型的“脑容量”。一般来说,脑容量越大,懂的知识越多,画出来的细节越丰富,而Nano-Banana Pro之所以文生图的效果极为出色,很大一部分原因就在于谷歌训练出来的极高参数量。

但代价就是,你得有个好显卡伺候着。

以最近开源的Flux 2为例,32B的参数量,你不掏个24GB显存的3090/4090,基本连启动这一关都过不去。



(图源:Flux 2)

但Z-image这个6B就很灵性了。

小雷看了一下官方文档,它的硬件门槛简直低得让人感动。哪怕你是好几年前的 RTX 3060,或者是随便整一张显存6GB的消费级主流显卡,配合上现在成熟的量化技术,也能跑得飞起。

这就意味着,你不用为了玩个AI画图,还得专门去配台主机。你手边那台用来打LOL的游戏本,甚至是一些高性能的轻薄本,都能变成你的创意工坊。

要把这个东西跑起来,其实很简单。

讲究一点的,你可以去Hugging Face下载模型,搭配上tonyhub这类简洁前端和一条工具流就能用。

不太讲究的,只要下载ComfyUI最新版,或者是升级一下本地版,就直接可以使用了,都不需要安装第三方节点。工作流已经内置了,只需要打开模板,点击Z-image-Turbo即可,接下来按照官方提示下载、放置模型就OK了。



(图源:ComfyUI)

当然,如果你说小雷我连显卡都没有,是核显用户怎么办?

也没事,现在像这种开源模型,Hugging Face和阿里的魔搭社区(ModelScope)上通常都有现成的在线Demo。虽然排队可能要等一会儿,但胜在白嫖,不用白不用嘛。

实战表现:体积小却很精悍

不过,光说不练假把式。参数小了,效果是不是也跟着缩水了?

为了验证这点,我也做了一些测试,用相同的Prompt,看看它和目前国内外常用的两家图片生成大模型的对比。

先看几个纯粹的生图效果。

Prompt:人类考古学家在金字塔挖掘现场发现一个旋转金属球的真实手持拍摄,手持纪录片现实主义,真实手持风格。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,只有Nano-Banana Pro能够还原出纪录片拍摄的界面和质感。

至于Z-image和豆包,他俩在这张图片上的表现其实相差无几,但是Z-image图片的一致性则明显有点偏高,多次反复尝试,在相同参数下得出来的结果都是极为相似的,根据网友分析,可能是内置参数带来的影响。



(图源:Z-image)

再来一张人像,试试三家的成色。

Prompt:一张平平无奇的iPhone照片,无精心构图和打光,日常快拍,松弛氛围感亚洲美女,穿着宽松厚毛衣与牛仔阔腿裤,舒适随性。她随意站在街头或咖啡馆门口,肩上自然背着一只单肩包,款式简洁低调,增添生活气息。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,三张图片都没有什么问题,都可以做到真实感强,光影自然,画面里头也不存在明显的呲漏。

要真说有啥不同,明显Z-image和豆包更符合国人审美,而Nano-Banana Pro生成的华人有明显的ABC特征。

接下来,我们试一下简单的海报设计,Prompt太长就不在这里列举了:







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图很有意思,可以看出,在更新迭代后,Nano-Banana Pro应对一般的中文嵌入已经没啥问题了。

论细节和光影的话,这我觉得大家都在伯仲之间。

既然单格图片问题不大,那么多格图片教程又如何呢?

Prompt:手账风格,出一个番茄炒蛋的制作步骤教程图,步骤说明要中文,落款是##。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图差距就很明显了,我们不难看出,只有Nano-Banana Pro能够掌握多格图片的生成和数字顺序的含义,基本上一次出图。

Z-image这边,粗看是有那么点意思,但是数字标注完全是错的。

最后,让我们看看二次元/漫画图片的生成。

Prompt:日本漫画风格,初音未来和洛天依撕开一张海报并穿越到现实中,酷炫的彩铅作画,动态多彩的画面。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这一对比,差距马上就出来了,只有Nano-Banana Pro知道两位角色,构图也很有意思,豆包虽然没有洛天依的概念,但是起码还有个构图的优势,Z-Image就是根本不知道在干些什么了。

只能说,在知识量这块,Z-Image确实还是比不上闭源模型。

至于图生图,或者图片编辑之类的能力,目前开源的Z-Image-Turbo是没有的,咱们还是等等Z-Image-Edit吧。

评测总结:堪称图片AIGC开源界扛把子?

测完这几轮,小雷心里的评价大概有了谱。

Z-image强吗?强。

在中文语境的理解、在单张图片的审美、以及最重要的——在硬件资源的利用率上,它简直是当下开源界的T0级别。

虽然在复杂推理和精准编辑上,它还打不过Nano-Banana Pro这样的闭源大佬,目前也缺失了图片编辑相关的能力,但在90%的日常使用场景里,它已经能做到“够用”甚至“好用”。

这对于那些想尝试AIGC的中小企业,或者是像我们这种想在本地搞搞创作的个人用户来说,意义太大了。

而且别忘了,它是开源的。

这意味着什么?意味着明天可能就会有大神在它的基础上,训练出专门画二次元的、专门画建筑设计的、专门做电商海报的各种微调模型。



(图源:Reddit)

就像当年的安卓手机一样,一开始可能不如苹果流畅,但架不住玩的人多、改的人多,生态一旦起来了,那爆发力是惊人的。

所以,如果你问小雷:Z-image值得折腾吗?

我的回答是:只要你有张显卡,哪怕是入门级的,都值得下下来玩玩。

毕竟,不用花钱,不用买昂贵的算力,就能在自己硬盘里养一个随叫随到的画手,这种把技术握在自己手里的感觉,可是那些在线生成平台给不了的。

而且按照阿里这个“卷”法,我有预感,明年这个时候,我们可能就能在手机上跑这种级别的模型了。

到时候,人人都是神笔马良的时代,可能真的就不远了。

CES2026开幕在即!(1月6日-1月9日)
作为中国报道科技展会最悠久、最深入、最专业的新媒体,雷科技CES2026报道团正在进行紧张的前期筹备。届时雷科技将派出史上最大规模的CES报道团,并由雷科技创始人兼总编辑罗超带队,对CES2026进行一线、专业和立体报道,敬请期待!



声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
越媒:为何越南U23三天前惨败给中国,三天后就战胜了韩国?

越媒:为何越南U23三天前惨败给中国,三天后就战胜了韩国?

星耀国际足坛
2026-01-24 13:45:33
法国退出北约,动议已提交给法国议会!

法国退出北约,动议已提交给法国议会!

达文西看世界
2026-01-18 17:30:27
双色球再现“顺子尾号”?井喷出现32注大奖,彩民:这运气太假?

双色球再现“顺子尾号”?井喷出现32注大奖,彩民:这运气太假?

复转这些年
2026-01-24 23:56:50
深夜利好!100亿商业航天龙头即将IPO,核心受益股有这21个龙头

深夜利好!100亿商业航天龙头即将IPO,核心受益股有这21个龙头

鹏哥投研
2026-01-24 09:22:21
陈孝良蒋林伶官宣结婚,两人参与恋爱综艺相识并牵手

陈孝良蒋林伶官宣结婚,两人参与恋爱综艺相识并牵手

韩小娱
2026-01-24 10:22:40
女游客在新疆被雪豹咬伤面部,“雪山之王”为何亮出獠牙?

女游客在新疆被雪豹咬伤面部,“雪山之王”为何亮出獠牙?

新民周刊
2026-01-24 18:13:18
铁证如山!高市火速“跑路”,安倍晋三死因逆转,凶手竟是受害人

铁证如山!高市火速“跑路”,安倍晋三死因逆转,凶手竟是受害人

妙知
2026-01-23 16:37:53
饲养员用金属锁多次猛砸小象头部,西双版纳野生动物园致歉:饲养员操作不规范,已严肃批评教育

饲养员用金属锁多次猛砸小象头部,西双版纳野生动物园致歉:饲养员操作不规范,已严肃批评教育

封面新闻
2026-01-24 19:19:03
顶流就是顶流,到哪儿都发光!

顶流就是顶流,到哪儿都发光!

碧波万览
2026-01-25 00:26:16
特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

影孖看世界
2026-01-23 23:49:11
4年时间门店从0增至960家,全国开店的零食品牌,如今陷入闭店争议!官方回应:主动放缓是策略,不是叫停加盟

4年时间门店从0增至960家,全国开店的零食品牌,如今陷入闭店争议!官方回应:主动放缓是策略,不是叫停加盟

每日经济新闻
2025-12-28 23:52:06
半场2球落后!媒体人热议:中国队不可谓不努力 硬实力确实有差距

半场2球落后!媒体人热议:中国队不可谓不努力 硬实力确实有差距

画夕
2026-01-25 00:04:18
广东双杀山西,赛后4个好消息和1个坏消息,跟队记者透露徐杰伤情

广东双杀山西,赛后4个好消息和1个坏消息,跟队记者透露徐杰伤情

邹维体育
2026-01-24 22:45:58
藏匿9年的本·拉登:5米高墙铁丝网防护,致命破绽是院中晾衣绳

藏匿9年的本·拉登:5米高墙铁丝网防护,致命破绽是院中晾衣绳

通鉴史智
2026-01-23 14:52:23
整天开会有啥必要啊?

整天开会有啥必要啊?

北京老付
2026-01-20 10:59:33
捡走吃掉赔8000元!2023年捡到一只回家煲汤,被人发现时只剩骨头

捡走吃掉赔8000元!2023年捡到一只回家煲汤,被人发现时只剩骨头

万象硬核本尊
2026-01-22 19:47:55
重兵压境 航母静默 美国真要对伊朗动手了?

重兵压境 航母静默 美国真要对伊朗动手了?

上游新闻
2026-01-23 20:24:12
好看的打扮不管在哪,都很吸引人

好看的打扮不管在哪,都很吸引人

美女穿搭分享
2026-01-01 11:01:35
国乒男单新榜样!小将夺冠专赢欧美壮汉,比王楚钦林诗栋特点突出

国乒男单新榜样!小将夺冠专赢欧美壮汉,比王楚钦林诗栋特点突出

三十年莱斯特城球迷
2026-01-24 22:26:49
今晚,一起为中国队加油!极目新闻全平台直播U23国足冲击亚洲之巅

今晚,一起为中国队加油!极目新闻全平台直播U23国足冲击亚洲之巅

极目新闻
2026-01-24 13:05:50
2026-01-25 00:56:49
雷科技 incentive-icons
雷科技
专注AI硬科技
35919文章数 811778关注度
往期回顾 全部

科技要闻

黄仁勋现身上海菜市场

头条要闻

张又侠、刘振立被查 解放军报发布社论

头条要闻

张又侠、刘振立被查 解放军报发布社论

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

游戏
本地
数码
亲子
公开课

梦幻西游珍宝阁拿下新出第一化生神衣,毅力帝300万帮贡求超越?

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

数码要闻

UnifyDrive UC250/450 Pro家庭存储NAS发布,配置与价格曝光

亲子要闻

幼儿园体能课秒变“绝活”秀场! 萌娃个个身手不凡,活力满满~ #睡个好觉

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版