网易首页 > 网易号 > 正文 申请入驻

阿里千问Z-Image实测来了!不输Banana,开源王者?

0
分享至

原本,小雷以为今年下半年AI圈子的热闹,也就是那样了。

闭源这边,由Gemini 3 Pro驱动的Nano-Banana Pro,几乎改变了大家对于平面设计的认知;开源这边,Flux 2.0的突然开源,也让普通人能够自行部署的图像生成效果大大提升,只要优化做得好,人人都能跑出像模像样的图。

那时候同事还跟我打赌,说这两款大模型的风潮,最起码能领跑个半年。

结果没想到,打脸来得这么快。

就在这两天,阿里的通义千问团队突然甩出了一张王炸——Z-image,上线即登顶开源社区热门榜第一位。



(图源:Hugging Face)

这名字听着挺硬核,但真正吓人的是它的定位:一款60亿参数(6B)的开源图像生成模型。

这消息一出来,我和同事都在群里炸锅了。要知道,在现在的生图领域,6B这个参数量,基本就是个弟弟。隔壁那些动不动几十B甚至上百B的大模型,光是权重文件下载下来都能把硬盘塞满。

阿里这是要干嘛?拿个“弟弟”来跟一群肌肉猛男打擂台?

带着这种好奇,小雷第一时间去把Z-image给拖了下来,还特意找来了两个当红炸子鸡——字节的豆包和最近红得发紫的Nano-Banana Pro,看看这仨的差距到底在哪?

千问Z-image体积小,部署门槛超低

先别急着看图,咱们得先聊聊这个Z-image到底是个什么来头,以及如果你想玩,得准备点啥。

按照官方介绍,Z-Image(中文名“造相”)是阿里巴巴通义实验室研发并开源的高效图像生成基础模型,定位为“轻量且高性能”的AI图像解决方案,对标参数量20B以上的闭源旗舰模型。

而这款产品本身,参数量只有6B。

在AI界,参数量大概可以理解为模型的“脑容量”。一般来说,脑容量越大,懂的知识越多,画出来的细节越丰富,而Nano-Banana Pro之所以文生图的效果极为出色,很大一部分原因就在于谷歌训练出来的极高参数量。

但代价就是,你得有个好显卡伺候着。

以最近开源的Flux 2为例,32B的参数量,你不掏个24GB显存的3090/4090,基本连启动这一关都过不去。



(图源:Flux 2)

但Z-image这个6B就很灵性了。

小雷看了一下官方文档,它的硬件门槛简直低得让人感动。哪怕你是好几年前的 RTX 3060,或者是随便整一张显存6GB的消费级主流显卡,配合上现在成熟的量化技术,也能跑得飞起。

这就意味着,你不用为了玩个AI画图,还得专门去配台主机。你手边那台用来打LOL的游戏本,甚至是一些高性能的轻薄本,都能变成你的创意工坊。

要把这个东西跑起来,其实很简单。

讲究一点的,你可以去Hugging Face下载模型,搭配上tonyhub这类简洁前端和一条工具流就能用。

不太讲究的,只要下载ComfyUI最新版,或者是升级一下本地版,就直接可以使用了,都不需要安装第三方节点。工作流已经内置了,只需要打开模板,点击Z-image-Turbo即可,接下来按照官方提示下载、放置模型就OK了。



(图源:ComfyUI)

当然,如果你说小雷我连显卡都没有,是核显用户怎么办?

也没事,现在像这种开源模型,Hugging Face和阿里的魔搭社区(ModelScope)上通常都有现成的在线Demo。虽然排队可能要等一会儿,但胜在白嫖,不用白不用嘛。

实战表现:体积小却很精悍

不过,光说不练假把式。参数小了,效果是不是也跟着缩水了?

为了验证这点,我也做了一些测试,用相同的Prompt,看看它和目前国内外常用的两家图片生成大模型的对比。

先看几个纯粹的生图效果。

Prompt:人类考古学家在金字塔挖掘现场发现一个旋转金属球的真实手持拍摄,手持纪录片现实主义,真实手持风格。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,只有Nano-Banana Pro能够还原出纪录片拍摄的界面和质感。

至于Z-image和豆包,他俩在这张图片上的表现其实相差无几,但是Z-image图片的一致性则明显有点偏高,多次反复尝试,在相同参数下得出来的结果都是极为相似的,根据网友分析,可能是内置参数带来的影响。



(图源:Z-image)

再来一张人像,试试三家的成色。

Prompt:一张平平无奇的iPhone照片,无精心构图和打光,日常快拍,松弛氛围感亚洲美女,穿着宽松厚毛衣与牛仔阔腿裤,舒适随性。她随意站在街头或咖啡馆门口,肩上自然背着一只单肩包,款式简洁低调,增添生活气息。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

在这组图片中,三张图片都没有什么问题,都可以做到真实感强,光影自然,画面里头也不存在明显的呲漏。

要真说有啥不同,明显Z-image和豆包更符合国人审美,而Nano-Banana Pro生成的华人有明显的ABC特征。

接下来,我们试一下简单的海报设计,Prompt太长就不在这里列举了:







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图很有意思,可以看出,在更新迭代后,Nano-Banana Pro应对一般的中文嵌入已经没啥问题了。

论细节和光影的话,这我觉得大家都在伯仲之间。

既然单格图片问题不大,那么多格图片教程又如何呢?

Prompt:手账风格,出一个番茄炒蛋的制作步骤教程图,步骤说明要中文,落款是##。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这组图差距就很明显了,我们不难看出,只有Nano-Banana Pro能够掌握多格图片的生成和数字顺序的含义,基本上一次出图。

Z-image这边,粗看是有那么点意思,但是数字标注完全是错的。

最后,让我们看看二次元/漫画图片的生成。

Prompt:日本漫画风格,初音未来和洛天依撕开一张海报并穿越到现实中,酷炫的彩铅作画,动态多彩的画面。







(自上而下为,Z-image/豆包/Nano-Banana Pro)

这一对比,差距马上就出来了,只有Nano-Banana Pro知道两位角色,构图也很有意思,豆包虽然没有洛天依的概念,但是起码还有个构图的优势,Z-Image就是根本不知道在干些什么了。

只能说,在知识量这块,Z-Image确实还是比不上闭源模型。

至于图生图,或者图片编辑之类的能力,目前开源的Z-Image-Turbo是没有的,咱们还是等等Z-Image-Edit吧。

评测总结:堪称图片AIGC开源界扛把子?

测完这几轮,小雷心里的评价大概有了谱。

Z-image强吗?强。

在中文语境的理解、在单张图片的审美、以及最重要的——在硬件资源的利用率上,它简直是当下开源界的T0级别。

虽然在复杂推理和精准编辑上,它还打不过Nano-Banana Pro这样的闭源大佬,目前也缺失了图片编辑相关的能力,但在90%的日常使用场景里,它已经能做到“够用”甚至“好用”。

这对于那些想尝试AIGC的中小企业,或者是像我们这种想在本地搞搞创作的个人用户来说,意义太大了。

而且别忘了,它是开源的。

这意味着什么?意味着明天可能就会有大神在它的基础上,训练出专门画二次元的、专门画建筑设计的、专门做电商海报的各种微调模型。



(图源:Reddit)

就像当年的安卓手机一样,一开始可能不如苹果流畅,但架不住玩的人多、改的人多,生态一旦起来了,那爆发力是惊人的。

所以,如果你问小雷:Z-image值得折腾吗?

我的回答是:只要你有张显卡,哪怕是入门级的,都值得下下来玩玩。

毕竟,不用花钱,不用买昂贵的算力,就能在自己硬盘里养一个随叫随到的画手,这种把技术握在自己手里的感觉,可是那些在线生成平台给不了的。

而且按照阿里这个“卷”法,我有预感,明年这个时候,我们可能就能在手机上跑这种级别的模型了。

到时候,人人都是神笔马良的时代,可能真的就不远了。

CES2026开幕在即!(1月6日-1月9日)
作为中国报道科技展会最悠久、最深入、最专业的新媒体,雷科技CES2026报道团正在进行紧张的前期筹备。届时雷科技将派出史上最大规模的CES报道团,并由雷科技创始人兼总编辑罗超带队,对CES2026进行一线、专业和立体报道,敬请期待!



声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大批“宇航员”排队打卡内蒙乌兰哈达火山,景区:内部环境似火星地表,牧民提供“宇航服”出租服务,休眠火山很安全

大批“宇航员”排队打卡内蒙乌兰哈达火山,景区:内部环境似火星地表,牧民提供“宇航服”出租服务,休眠火山很安全

极目新闻
2026-05-04 16:07:52
谢娜演唱会,把娱乐圈的“遮羞布”彻底撕碎了!

谢娜演唱会,把娱乐圈的“遮羞布”彻底撕碎了!

陈意小可爱
2026-05-06 10:00:53
梁靖崑输球原因曝光!王楚钦为队友发声,王皓表情包走红

梁靖崑输球原因曝光!王楚钦为队友发声,王皓表情包走红

老王大话体育
2026-05-07 01:05:21
最耻辱一战!大连全队评分:李国旭最低!阿奇老毕尚可 4人不及格

最耻辱一战!大连全队评分:李国旭最低!阿奇老毕尚可 4人不及格

刀锋体育
2026-05-06 22:55:26
情路悠长,心健为岸:择一情绪温润之人,共赴岁月情深

情路悠长,心健为岸:择一情绪温润之人,共赴岁月情深

青苹果sht
2026-04-09 05:35:52
姆巴佩崩溃!他离队2年巴黎全进欧冠决赛 1900万皇马球迷要他离队

姆巴佩崩溃!他离队2年巴黎全进欧冠决赛 1900万皇马球迷要他离队

风过乡
2026-05-07 05:59:56
一场1-1!欧冠疯狂夜!巴黎连续2年进决赛!拜仁绝平仍出局

一场1-1!欧冠疯狂夜!巴黎连续2年进决赛!拜仁绝平仍出局

小犙拍客在北漂
2026-05-07 06:42:35
济南地区突降暴雨 网友拍下彩色闪电

济南地区突降暴雨 网友拍下彩色闪电

闪电新闻
2026-05-07 00:50:22
四年战争带给普京的副作用最终爆发。。。

四年战争带给普京的副作用最终爆发。。。

西楼饮月
2026-05-05 22:50:03
追觅科技创始人兼CEO俞浩自曝不买任何股票:建议年轻人别炒股,45岁以后才应“钱生钱”

追觅科技创始人兼CEO俞浩自曝不买任何股票:建议年轻人别炒股,45岁以后才应“钱生钱”

大象新闻
2026-05-06 16:46:07
国乒男团为何能进4强?王皓对林诗栋态度转变,邓亚萍谈男队表现

国乒男团为何能进4强?王皓对林诗栋态度转变,邓亚萍谈男队表现

体育大学僧
2026-05-06 21:30:56
留美“全线熔断”!?川普团队精准狙击留美家庭所有重要节点...

留美“全线熔断”!?川普团队精准狙击留美家庭所有重要节点...

华人生活网
2026-05-07 03:55:15
为什么发达国家对中国都不友好?

为什么发达国家对中国都不友好?

新浪财经
2026-05-04 07:26:54
俄罗斯“主动邀请”乌克兰无人机5月9日到访莫斯科!!!

俄罗斯“主动邀请”乌克兰无人机5月9日到访莫斯科!!!

山河路口
2026-05-06 20:00:52
关注中美高层互动,民进党当局忧虑自身上“菜单”

关注中美高层互动,民进党当局忧虑自身上“菜单”

京彩台湾
2026-05-06 09:04:21
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
苏州一市场禁止剥蚕豆引发热议,网友称有人吃蚕豆后会引发蚕豆病,市场工作人员回应

苏州一市场禁止剥蚕豆引发热议,网友称有人吃蚕豆后会引发蚕豆病,市场工作人员回应

齐鲁壹点
2026-05-06 17:05:49
悲催!杭州一女子嫌国企丈夫没本事,携42万存款离婚,鸡飞蛋打了

悲催!杭州一女子嫌国企丈夫没本事,携42万存款离婚,鸡飞蛋打了

火山詩话
2026-04-27 06:40:09
卡里克转正首签!锁定拜仁新援,曼联夏窗将围绕“卡式战术”重建

卡里克转正首签!锁定拜仁新援,曼联夏窗将围绕“卡式战术”重建

体坛鉴春秋
2026-05-06 18:00:06
江苏多地公布中小学暑假安排

江苏多地公布中小学暑假安排

极目新闻
2026-05-06 18:07:12
2026-05-07 07:23:00
雷科技 incentive-icons
雷科技
专注AI硬科技
37006文章数 812075关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

游戏
亲子
房产
公开课
军事航空

LPL第二赛段:滔搏排名迅速滑落!JDG三局战胜TES

亲子要闻

兜儿晒女儿被说像小猪妹,一句话直接回应:她们俩都是同一个爸爸

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版