网易首页 > 网易号 > 正文 申请入驻

Nano Banana 2登顶Arena第一,我拿5个真实项目测了一遍

0
分享至


昨天Nano Banana 2发布了。

说实话,AI生图模型更新这么频繁,大多数时候我已经不太激动了。但NB2确实有点不一样——它在Arena的text to image盲测里直接冲到了第一名,超过了自家的Nano Banana Pro,也超过了GPT Image。


而且不是靠画质碾压的。NB2的底层从Gemini 3 Pro换成了Gemini 3.1 Flash,跑得更快、成本更低,但画面质量几乎没掉。

放一组对比数据:


速度从每张10-20秒降到4-6秒。Arena ELO从1223拉到1280。价格几乎全线腰斩——1K分辨率$0.134→$0.067,4K从$0.240→$0.151。中文渲染从「偶尔笔画出错」升级到了商用级别。唯一的代价是放大到像素级对比时NBP稍微精细一点,日常用肉眼看不出。

速度快一倍,价格砍一半,效果还排第一。只能说在文生图领域,Google的领先优势越来越明显了。

不过模型归模型。NB2是通过API调用的,每张图按量收费,还得有Google Cloud账号才能用——对国内用户来说这本身就是个门槛。

所以,我这次选择在Lovart上测NB2。Lovart直接集成了NB2,不需要折腾API。更关键的是,Pro会员闲时0积分无限生成——NB2本来按张收费的东西,在这里变成了包月不限量。

而且Lovart不只是套了个模型壳子。生成之后它还有一整套编辑能力:改文字、改细节、去背景、贴样机、拆图层。后面5个案例里都会用到。

上篇文章之后,最多人问的两个问题

前阵子我写了一篇「」,讲我给Claude Code做的PPT Skill。那个Skill有两条路径——Path A是HTML转PPT,文字可编辑;Path B是用Nano Banana Pro生成全AI插画,视觉冲击力强很多,但文字就烧死在图里了。

文章发出去之后,问的最多的不是Skill怎么写。

第一个问题:国内怎么用Nano Banana?Path B要调Gemini API,很多人要么没Google账号,要么网络不通。功能再好,卡在访问这步就没用。

第二个问题:AI生成的PPT图片能编辑吗?其实这不只是PPT的问题。所有用AI生图的人都碰过——出了一张很满意的海报,客户说把标题改一下,只能重新生成碰运气。

在Lovart上用NB2,这两个问题正好一起解了。

不过光说没用。我拿了5个自己真实在做的项目跑了一遍。

案例1:PPT演讲素材批量生成

先测最直接的——上篇PPT文章里的Path B,用AI生成幻灯片配图。

之前我是在Claude Code里调Gemini API,一页一页生成。这次直接在Lovart里操作,把PPT大纲丢进去,让NB2批量出一整套。

前阵子我刚做完一个企业AI培训,两天课程做了131页PPT。那次用的Neo-Brutalism风格——粗黑边框、高饱和色块、超大字,投影到10米外都看得清。这次换个方向,用温暖叙事风格重做一版,试试NB2。

上传了自己的照片做角色参考,写prompt:

为一场AI培训设计演讲幻灯片插画。所有文字必须是简体中文。
风格:温暖叙事风格的教育插画,像TED演讲配图或Airbnb品牌插画的叙事感。
暖色调(奶油色背景),圆润的人物造型,手绘线条质感。
讲师形象参考上传的照片,贯穿每一页。

第1页:封面「AI时代的个人生产力升级」
— 讲师站在一面巨大的白板前,白板上密密麻麻写满了关键词:
Claude Code、GPT-5、DeepSeek、Agent、Skills……
讲师回头看向观众,表情像在说「别慌,我帮你理清楚」

第2页:「差提示词 vs 好提示词」
— 画面左右分屏对比。左边:一个人对着电脑只打了一行字「帮我分析数据」,
电脑屏幕上冒出一堆杂乱的结果。右边:同一个人列出了清晰的四层结构
(角色、任务、上下文、约束),电脑屏幕上输出整齐的报告。
左侧标注「一句话丢给AI」,右侧标注「4层结构提示词」

第3页:「从提示词到工作流到Skills — 三级进化」
— 画面是一个纵向的三层阶梯。底层:一个人坐在电脑前打字(标注「提示词:用一次」)。
中层:同一个人面前展开一条流水线,多个步骤自动流转(标注「工作流:用一个月」)。
顶层:一个人站在控制台前,多个Agent同时在工作(标注「Skills & Agent:用一年」)


简答说明下我做PPT时的提示词逻辑。一个是尽量提供明确的风格供NB2理解和参考。 比如我这次要求「像TED演讲配图」或具体品牌名(Airbnb插画风格),AI就知道该往哪个方向走了。第二,每页的文字内容要写全——不要只写「封面」两个字,把标题、标注、对比文案全写进prompt,NB2才能准确渲染。第三,描述画面用叙事而不是布局指令——「讲师回头看向观众,表情像在说别慌」比「讲师站在画面中央」有效得多。

这次生成的三页幻灯片中文字符算是非常准确。

不过呢,还有一个AI生图的经典问题:抽卡。10张图里总有一两张细节不对。比如这次第一张封面,讲师的帽子变成了鸭舌帽,但我的参考照片和其他页面里都是渔夫帽。以前碰到这种情况只能重新生成碰运气。

Lovart有个很顺手的操作——按住Command键点击图片上的具体位置(比如帽子),直接告诉它「改成和参考图一样的渔夫帽」。只改帽子,其他内容不动。

指哪改哪,跟在Figma里点图层一样直觉。

改完了的效果也相当符合预期,你可以看到,除了帽子,图片任何细节都没改


案例2:小猫补光灯IP周边设计

这是我一直想做但没动手的事。

小猫补光灯是我做的一款iOS app,在App Store付费榜拿过第一。但作为独立开发者,从来没认真做过周边——笔、徽章、钥匙扣、贴纸这些。不是不想,是设计成本太高,找设计师做一套周边视觉少说几千块。

这次用NB2试试。

上传了小猫补光灯的logo做风格参考,写prompt:

设计一套App周边产品概念图。品牌:小猫补光灯(一款可爱风格的iOS相机应用)。
IP形象参考我给你发的图片。


请生成以下周边产品的设计概念:
1. 金属胸针/徽章 - 小猫举着迷你补光灯,搪瓷工艺质感
2. 中性笔 - 笔帽是小猫头部造型,笔身印有品牌logo
4. 亚克力钥匙扣 - 透明底+小猫剪影


周边产品的prompt关键在两点。一是材质要具体——不能只说「设计一个徽章」,得说「搪瓷工艺质感」「亚克力透光效果」,AI才知道你要什么样的渲染。二是品牌元素前置——先定IP形象,再展开具体产品,整套周边的视觉语言才统一。

结果挺让我意外。NB2出的周边概念图产品感很强——不是扁平的示意图,是有材质、有光影、看起来像实物的效果。金属徽章有搪瓷质感,钥匙扣我尤其喜欢,有亚克力的透光感。

看到这几个周边设计,我还真有种强烈的要去某宝找商家做出来的冲动了。

案例3:App图标套件生成

这个场景我之前在另一篇文章里做过——用Nano Banana Pro给我的小猫相册app生了一整套定制图标,每个图标都是一只小猫在做不同的事。当你app中的设计元素不止是AI用代码生成,或者引用开源图标库的时候,那给用户的质感确实会大大不同。

我的新版app在小红书发布后,受到了上百名女生的夸夸,用户评价从「还行」变成了「好可爱」。



这次再用NB2教一下大家流程。

关键操作是垫图。你需要先多尝试不同风格,生成一版你满意的图标给NB2作为参考,以及你可以让AI编程工具梳理出你的app中需要用到的icon名称和样式,然后批量生成:

参考上传的logo风格(圆润线条、暖黄配色、可爱小猫形象),
为一款相机类App生成一套功能图标,统一风格。3D卡通渲染,
柔和光影,白色背景,每个图标中小猫在执行对应功能的动作:


1. 补光模式 - 小猫举着一盏发光的灯
2. 美颜滤镜 - 小猫对着镜子涂腮红
3. 定时拍照 - 小猫看着沙漏倒计时
4. 相册浏览 - 小猫翻阅一本厚厚的相册
5. 分享导出 - 小猫把照片从窗口递出去
6. 设置 - 小猫拿着扳手拧螺丝
7. 夜景模式 - 小猫戴着夜视仪
8. 连拍模式 - 小猫手持多台相机同时拍


我再来拆解下图标设计的这套Prompt。 批量图标最重要的原则:垫图 > 文字描述。100个形容词不如一张参考图。Prompt里的风格描述(「圆润线条、暖黄配色」)是辅助,垫图才是风格锚点。另外每个图标的动作要有画面感——不是「补光功能」而是「小猫举着一盏发光的灯」,给AI一个可以构图的场景。

NB2有垫图的情况下,风格一致性挺好。8个图标出来,配色、线条粗细、小猫造型基本统一。之前用NBP做小猫相册那套时,偶尔有一两个风格飘掉的。NB2稍微稳一些。

不过有个问题:NB2没法直接出透明背景。每个图标都带着白色或彩色底,没法直接丢进app里用。我之前的做法是用Claude Code写代码来帮我切图和抠图,效果大致也能用。

不过用Lovart的话,抠图这一部分都可以直接省了。你可以直接在Lovart上给生成的图标移除背景。点一下,背景就没了,干净的透明底PNG。8个图标逐个去了背景,整套可以直接拿去Xcode里用。

案例4:短剧分镜批量出图

这个案例专门测NB2的规模能力——不是出几张看效果,而是连续生成分镜,看角色一致性和风格稳定性能不能撑住。

第一步,先定角色。在Lovart里用NB2生成女主角:

一位穿白衬衫的中国年轻女性,短发,干练气质。
电影感构图,柔和自然光,35mm镜头质感。

多抽了几次,选一张最满意的做角色参考。这步很重要——后面所有分镜都拿这张图做角色锚点。


角色定了,开始批量出分镜。先跑第一集6个镜头:

中国都市情感短剧分镜。电影感构图,柔和自然光,
35mm镜头质感,浅景深。画面比例均为9:16。
角色:参考我提供的角色图片。


第1集·离开
镜头1:【全景】女主站在写字楼落地窗前,俯瞰城市天际线,背影,夕阳光
镜头2:【特写】女主的手放在辞职信上,指尖微微颤抖,桌面有咖啡杯和笔记本
镜头3:【中景】女主走出公司大门,阳光打在脸上,表情释然
镜头4:【全景】女主在胡同口的咖啡馆坐下,周围是老北京的砖墙和绿植
镜头5:【特写】手机屏幕上显示「新消息:项目通过了」,女主嘴角上扬
镜头6:【远景】女主骑自行车穿过林荫道,光斑透过树叶洒下来


这部分分镜生成的工作流核心是「先定角色,再铺场景」。 不要在每个镜头里重复描述角色长什么样——直接上传之前选好的参考图,让AI看图而不是读文字。每个镜头只描述三件事:景别(全景/中景/特写)、场景环境、角色动作。另一个关键:用具体的视觉信息替代情绪形容词——不写「女主很开心」,写「嘴角上扬」「阳光打在脸上」。

第一集6张跑完,角色一致性保持得不错。这只是一个测试,流程跑通之后完全可以继续出第2集、第3集……一口气几十张甚至上百张。NB2的速度在这种规模下优势很明显——批量出图效率比NBP快了不少。

分镜只是第一步。Lovart上还集成了一堆主流的图生视频模型——Kling 3.0、Veo 3.1、Sora 2 Pro、Seedance 1.5 Pro、Hailuo 2.3——全在同一个平台里。

NB2批量出完分镜之后,不用切平台,直接在Lovart里选个视频模型,把分镜图一张张转成视频片段,串起来就是一个完整的短剧。从角色设计到分镜生成到图生视频到成片,全在一个地方。

做短剧、视觉小说的人应该会比较喜欢这个工作流。NB2负责快速出大量分镜,Lovart负责编辑和视频转换。365天闲时0积分无限生成,「先大量出图再筛选」的模式下试错成本几乎为零。

案例5:中文商业海报

最后测一个最日常的场景——做一张中文商业海报。也是测NB2中文渲染最直接的方法。

设计一张竖版手机海报(9:16)。主题:独立开发者线下分享会。
风格:日系清新插画,水彩质感笔触,暖色调。

画面内容:一个小型分享会场景,几位年轻人围坐在长桌旁,
桌上散落着笔记本电脑和咖啡杯,背景是大窗户透进的午后阳光。
分享的主持人请参考我提供的带着渔夫帽的照片人物形象。

文字内容(必须精准渲染):
主标题:「独立开发者的周末下午」
副标题:聊聊一个人做产品的那些事
时间:2026年3月15日 14:00
地点:深圳南山·万象天地 3F


中文海报有个容易忽略的技巧:文字要单独标注层级。不是在场景描述里随口提「上面写着XX」,而是把文字单独拎出来,标清「主标题」「副标题」「正文信息」——AI才知道哪些字大、哪些字小。另外风格描述加笔触质感(「水彩质感笔触」)比只写「日系风格」有效得多,笔触直接决定画面手感。

中文渲染是NB2比NBP提升最明显的地方。这张海报上有主标题、副标题、时间地点——4段不同层级的中文,NB2基本都渲染对了。NBP做同样的事情,大概率有一两个字出问题。

当然,在海报场景下,你很可能遇到的问题是,你同一张海报可能想在不同的场景下使用。或者,你的甲方突然喊你该需求了,比如要修改海报中提供的活动地点,通常情况下你在Gemini或者AI Studio里也能改,但是往往你要求只是改文字,但是模型能给你改一堆细节。

比如我想把活动地点从「深圳南山·万象天地」改成「北京西城区·西单大悦城」,日期从3月15日改成3月16日——在Lovart里用Text Edit直接点进去改。它会自动识别图片里的所有文字段落,你逐个调整就行。改完字体风格、大小、排版位置都不变,连水彩笔触的质感都保持住了。

测试中我碰到一个小问题:原图尺寸比较大的话,编辑文字之后图片分辨率会变小。不过Lovart也有「放大」功能,点一下就能把图片恢复高清。生成→编辑→放大,三步走完就是一张可以直接用的海报。最后的这两张图除了我要求修改的活动地点和时间外,其他细节都完美保持了一致。


5个案例跑完,说说真实感受

先说NB2。

速度和价格确实是这次最直接的体感。5个案例跑下来,NB2比NBP快了一大截,批量生成时差距尤其明显。画质日常使用分不出差别,中文渲染实打实好了很多。

再说Lovart。

我去年12月写过一篇Lovart的文章,当时说它是「设计界的Cursor」——不只是接了个API,而是提供了生成之后的完整编辑工作流。这次用下来,这个判断还是成立的。

5个案例里我用到了Text Edit改文字、Command+点击改细节、移除背景去透明底、还有放大恢复高清——这些在纯生图工具里都做不了,以前得丢进PS。

回到开头的两个问题。对上篇PPT文章的读者来说:国内直接在Lovart上用NB2,不用折腾API和网络;生成的图片用Text Edit直接改文字,不再烧死在图里。

其实这次测下来我有一个比较明确的感受:NB2这个级别的模型,单纯的「生成」已经不是瓶颈了。真正卡效率的是生成之后——改文字、调细节、去背景、贴场景。Lovart把这些都做进了同一个平台,NB2负责又快又好地出图,Lovart负责让出图变成能用的成品。

Pro会员365天闲时0积分无限用NB2和NBP,对做电商、短剧、PPT、社交媒体的人来说,这个组合挺值得试的:https://www.lovart.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子乘国际航班被机餐中的鱼刺卡喉 航司提出1000元补偿 当事人:只要书面道歉

男子乘国际航班被机餐中的鱼刺卡喉 航司提出1000元补偿 当事人:只要书面道歉

红星新闻
2026-02-27 18:50:08
工龄35年,上海55岁主治医师养老金真高啊!

工龄35年,上海55岁主治医师养老金真高啊!

乐天果果
2026-02-06 12:41:45
一次失败的扫黄行动

一次失败的扫黄行动

手高在民间
2026-02-27 09:16:15
李易峰祈福!素颜清秀似大学生,复出无望,活成了有钱有闲的普通人

李易峰祈福!素颜清秀似大学生,复出无望,活成了有钱有闲的普通人

八卦王者
2026-02-27 10:20:35
黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

揽星河的笔记
2025-12-08 13:30:38
康熙临终前,给胤禎一杯毒酒考验他,胤禎的举动,让康熙心头一震

康熙临终前,给胤禎一杯毒酒考验他,胤禎的举动,让康熙心头一震

千秋文化
2026-02-08 19:38:41
大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

通文知史
2026-02-26 22:00:04
不是贺希宁,不是赵继伟,日本主帅盛赞男篮1人,郭士强也没想到

不是贺希宁,不是赵继伟,日本主帅盛赞男篮1人,郭士强也没想到

萌兰聊个球
2026-02-27 15:29:54
已婚也逃不过!在爱泼斯坦的安排下,比尔盖茨和安妮·海瑟薇会面

已婚也逃不过!在爱泼斯坦的安排下,比尔盖茨和安妮·海瑟薇会面

你的雷达站
2026-02-23 23:10:17
比电子布还猛!光纤价格飙涨80%   这7大寡头迎戴维斯双击

比电子布还猛!光纤价格飙涨80% 这7大寡头迎戴维斯双击

元芳说投资
2026-02-26 06:00:08
别再死磕AI了!高盛预警:资金正疯狂涌入“低淘汰”重资产

别再死磕AI了!高盛预警:资金正疯狂涌入“低淘汰”重资产

流苏晚晴
2026-02-27 18:14:47
中戏的招生丑闻,彻底震惊了整个艺术圈!

中戏的招生丑闻,彻底震惊了整个艺术圈!

南权先生
2026-02-24 15:52:36
人这一辈子,有4件事“命中注定”,强求不来,只能顺其自然!

人这一辈子,有4件事“命中注定”,强求不来,只能顺其自然!

风起见你
2026-02-07 14:37:32
特朗普赢了,12架战机刚刚落地,伊朗先举了白旗:禁止发展核武器

特朗普赢了,12架战机刚刚落地,伊朗先举了白旗:禁止发展核武器

铁锤简科
2026-02-27 17:30:48
子女长大后为什么不心疼你,从你对他做这4件事开始,就错了

子女长大后为什么不心疼你,从你对他做这4件事开始,就错了

新东方家庭教育
2026-02-11 21:43:13
孩子越大,越要告诉他这五句人生真相:比成绩更重要的,是活好这一生

孩子越大,越要告诉他这五句人生真相:比成绩更重要的,是活好这一生

青苹果sht
2026-02-20 05:52:21
巴基斯坦第一波损失惨重,凌晨下令战机起飞:直接轰炸阿富汗首都

巴基斯坦第一波损失惨重,凌晨下令战机起飞:直接轰炸阿富汗首都

井普椿的独白
2026-02-27 17:38:38
门德斯回应内马尔:我只是希望他能多些尊重,他却出言不逊

门德斯回应内马尔:我只是希望他能多些尊重,他却出言不逊

懂球帝
2026-02-27 16:44:24
埃及世纪之劫

埃及世纪之劫

地缘与冲突
2026-02-27 12:00:06
3月5日起,深圳将投放超8万个粤B车牌号码!一大批靓号来啦!

3月5日起,深圳将投放超8万个粤B车牌号码!一大批靓号来啦!

深圳本地宝
2026-02-27 22:09:17
2026-02-28 01:36:49
AI进化论花生 incentive-icons
AI进化论花生
AI博主,AppStore付费榜第一的小猫补光灯app开发者
147文章数 64关注度
往期回顾 全部

数码要闻

雷克沙1TB高速固态U盘首发1119元:USB 3.2-A/C双接口

头条要闻

新华社:美国伊朗要打了吗

头条要闻

新华社:美国伊朗要打了吗

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

艺术
亲子
数码
家居
军事航空

艺术要闻

紫气东来,好运一整年!

亲子要闻

惊呆了!12岁小女孩抱弟弟如同妈妈般自然,背后真相感人至深!

数码要闻

Omdia:时隔5年,小米去年再度回归可穿戴设备出货榜首

家居要闻

素色肌理 品意式格调

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版