网易首页 > 网易号 > 正文 申请入驻

谷歌做了个论文专用版nano banana!顶会级Figure直出

0
分享至



编辑|SIA

你负责写方法,AI负责画 Figure。 科研打工人,终于等来「画图解放日」。

还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗?

一张 Figure 2,动辄几个小时,严重的甚至能耗上几天,科研人的「隐藏副本」不是实验,而是画图。

既要忠于论文原意,又得暗暗符合顶会那套心照不宣的「学术审美」:颜色不能土,布局不能乱,箭头更不能连错。

看起来只是一张图,实际上是美学、逻辑和耐心的三重折磨。

那么,问题来了:现在的大模型已经能写论文、跑实验、改代码,为什么偏偏搞不定这些学术插图?有人可能会问:DALL·E、基础 VLM 不行吗?

答案是:真不行。

它们画出来的图往往是:模块和文字对不上、字体直接乱码、箭头逻辑错误。图是「好看」,但不中用啊。

于是,一个狠角色出现了:PaperBanana

来自北大 + Google Cloud AI Research 的团队,目标很简单也很狂:你写方法,AI 画 Figure,水准呢?直接投顶会的那种。

科研打工人,终于等到了「画图解放日」。









来看效果成色。

PaperBanana 展示了解决两类学术插图的能力:

第一类,是论文方法流程图与模型结构示意图,用来说明算法如何运作(左);第二类,是统计图表,用来表达实验结果与数据对比(右边)。



左边是方法框图(Methodology Diagrams),右边是统计图(Statistical Plots)

与以往「只会画图像」的生成模型不同,PaperBanana 强调两点:不是只要「画得好看」,而是必须「画得正确」。

它要保证:模块之间的逻辑关系不出错、数据表达符合科研规范、图可以直接服务论文叙事,而不是装饰。

研究指出,PaperBanana 可以覆盖多种常见学术插图类型,包括方法流程图、模型结构示意图、概念性框架图,以及通过代码驱动生成的高精度统计图。

PaperBanana 不仅能从零生成,还能润色你现有的丑图。

给它一张草图或初版框图,它负责自动美化、重排布局、统一风格,让它更像顶会论文里的标准图形

更直观的对比——

左侧是手工绘制的插图,右侧是 PaperBanana 风格增强(Style Enhanced)后的版本。



这些示例覆盖了多个典型科研场景,包括 Transformer 与不同 LayerNorm 变体的对比示意、工程流程与三维建模管线的系统框架,以及强化学习和表示学习中抽象几何关系的表达。它们的共同特点在于逻辑复杂、元素密集,对人工排版提出了极高要求,也正是科研人员最容易在“画图”上消耗大量时间与精力的部分。

语义结构上一致,但视觉呈现,完全不同。

原始图信息完整,却给人一种「能看懂,但不好看」的感觉:布局略显松散,配色偏向单一,不同模块之间的层级关系也不够清晰。

PaperBanana 润色增后,图中的逻辑被重新梳理进一套更规范的视觉体系之中。

不同功能模块通过颜色进行区分,虚线和分区框用来强化层次结构,箭头的走向也更加明确,整体观感明显更接近顶会论文中常见的标准范式。

再看下面的图例,同一张图对比,高低立判。

人类画的图,对,但不一定好看。

未经调教的原始模型生成(Nano-Banana-Pro),画出来但难读。

PaperBanana 真正做到了「画清楚、讲明白」,也更符合顶会审美的论文级插图:配色更现代统一,信息更精炼,模块分区更清晰。



那么,它是如何做到这一点的?

PaperBanana「画论文图」变成了一条由多智能体协作完成的流水线。

系统先检索参考范例,再规划结构化描述,并在审美规范约束下生成初稿;

随后由视觉代理将文本描述转化为图像或代码绘图,评论代理不断对照原始论文内容进行纠错与打磨。

经过多轮迭代后,输出的不再是普通示意图,而是一张同时满足语义正确性与顶会审美标准的论文级插图。

这不是简单的作图自动化,而是一种「科研表达方式」的自动规范化。



研究人员还顺带对比了两种路线:直接让模型「画图」VS 让模型「写代码画图」。

结论很扎心:AI 直接画出来的图虽然精美,但经常在数字上胡说八道。

目前最靠谱的方式还是:AI 写绘图代码(基于 Gemini-3-Pro),再生成统计图。



这只是开始。类似工具已经开始出现,比如:Claude Scientific Writer,集成论文写作 + 插图 + 图表生成。

未来科研可能变成这样:你不用再在 PPT 里对齐箭头、调颜色、拖文本框到凌晨三点,而是把更多时间留给真正重要的事情。

https://dwzhu-pku.github.io/PaperBanana/

https://github.com/K-Dense-AI/claude-scientific-writer

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蛋白质:老年人的“生命线”,这6种优质蛋白食物,该吃就吃!

蛋白质:老年人的“生命线”,这6种优质蛋白食物,该吃就吃!

健康科普365
2026-02-03 07:45:06
原来他是杨利伟儿子,名校毕业工作成谜,曾与翟志刚儿子同班同学

原来他是杨利伟儿子,名校毕业工作成谜,曾与翟志刚儿子同班同学

人间无味啊
2026-02-05 22:47:23
微博之夜座位大战升级!杨幂团队率先发难,主办方道歉打工人背锅

微博之夜座位大战升级!杨幂团队率先发难,主办方道歉打工人背锅

萌神木木
2026-02-05 21:49:07
四川9名厅级干部职务调整

四川9名厅级干部职务调整

金台资讯
2026-02-05 16:51:36
爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

海佑讲史
2026-02-05 13:00:05
朱利亚诺:我不想活在父亲的光环下,所以我的球衣不印西蒙尼

朱利亚诺:我不想活在父亲的光环下,所以我的球衣不印西蒙尼

懂球帝
2026-02-05 22:10:06
偷鸡不成蚀把米,以为能“毁掉”金晨,不料自己先被扒了个底朝天

偷鸡不成蚀把米,以为能“毁掉”金晨,不料自己先被扒了个底朝天

吴霶爱体育
2026-02-04 01:26:05
勇士酝酿半天换来波尔津吉斯,这是一个玻璃人啊!

勇士酝酿半天换来波尔津吉斯,这是一个玻璃人啊!

爱体育
2026-02-05 21:54:56
爱泼斯坦死前48小时签署文件公开:将1亿美元赠予女友,曾考虑迎娶她并留下33克拉钻戒;最后一通电话打给她

爱泼斯坦死前48小时签署文件公开:将1亿美元赠予女友,曾考虑迎娶她并留下33克拉钻戒;最后一通电话打给她

观威海
2026-02-04 17:42:22
自杀式大交易,库明加单换老病号,金州的十天已经守完了

自杀式大交易,库明加单换老病号,金州的十天已经守完了

麦子的篮球故事
2026-02-05 21:18:20
戴手铐走完二万五千里,开国前夕去见毛主席,主席却问:你是哪一个?

戴手铐走完二万五千里,开国前夕去见毛主席,主席却问:你是哪一个?

寄史言志
2026-01-17 17:30:15
祖巴茨因与妻子的孩子出生缺战骑士!他俩是NBA高颜值夫妇

祖巴茨因与妻子的孩子出生缺战骑士!他俩是NBA高颜值夫妇

Emily说个球
2026-02-05 12:27:17
杨兰兰被追加2项罪名指控!今天澳洲又开庭!事态升级

杨兰兰被追加2项罪名指控!今天澳洲又开庭!事态升级

深度报
2026-02-05 21:17:16
广东新一轮以旧换新方案出炉!买家电最多可省1500元

广东新一轮以旧换新方案出炉!买家电最多可省1500元

南方都市报
2026-02-05 19:40:11
郑泽晖任深圳市副市长、市公安局局长

郑泽晖任深圳市副市长、市公安局局长

新京报
2026-02-05 17:20:07
今年过年请一定要这样穿:大衣+裙子+低跟鞋,每套都透着高级感!

今年过年请一定要这样穿:大衣+裙子+低跟鞋,每套都透着高级感!

时尚穿搭生活馆
2026-02-05 22:51:59
东契奇:我认为湖人是争冠队,与詹姆斯同场一切皆有可能

东契奇:我认为湖人是争冠队,与詹姆斯同场一切皆有可能

林子说事
2026-02-05 15:01:25
镜报差评C罗:2亿年薪却0冠!他无知、脾气臭!且榨干球队!

镜报差评C罗:2亿年薪却0冠!他无知、脾气臭!且榨干球队!

氧气是个地铁
2026-02-04 17:19:51
李亚鹏年会上哽咽发言:相信能度过难关 感谢那英、董宇辉等人捐款援助

李亚鹏年会上哽咽发言:相信能度过难关 感谢那英、董宇辉等人捐款援助

快科技
2026-02-05 18:07:36
中考对孩子压力巨大,分流意义已越来越小,可以为取消中考做好政策储备

中考对孩子压力巨大,分流意义已越来越小,可以为取消中考做好政策储备

纵相新闻
2026-02-05 17:25:02
2026-02-05 23:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12259文章数 142563关注度
往期回顾 全部

科技要闻

美团买下叮咚买菜,防御还是进击?

头条要闻

上海男子刚退休就瘫痪 小23岁女友照护崩溃:无名无分

头条要闻

上海男子刚退休就瘫痪 小23岁女友照护崩溃:无名无分

体育要闻

奇才:我学生……独行侠:成交!

娱乐要闻

微博之夜卷入座位风波!杨幂超话沦陷

财经要闻

中美"只会有好消息" 经济冷暖看房价

汽车要闻

李想为全新L9预热 all in AI造更好的车

态度原创

数码
教育
时尚
家居
军事航空

数码要闻

AMD "Medusa Halo"处理器被曝将支持LPDDR6内存

教育要闻

建议收藏|2027英本申请时间轴官宣!UCAS关键节点梳理,附G5名校雅思/规划方案

她随手打赏就是6两黄金:人美,心善,钱多!

家居要闻

简雅序章 自然且闲适

军事要闻

54岁荷兰王后以预备役军人身份参军 王室解释原因

无障碍浏览 进入关怀版