网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌北大联手学术版Banana爆火，论文图表100%精确生成

2026-02-05 14:12:12　来源: 量子位

北京举报

0

分享至

效果好到刷屏的Nano Banana，学术特供版热乎出炉！

名字就是如此直观——PaperBanana，给你每天都在头痛的Paper用上Banana。（试图押韵skr)

而且这一次是由谷歌北大强强联手打造。

知道你想马上看效果，别急，三个官方案例这就给大家搬上桌。

在相同输入下，人类绘制、原版Nano Banana与PaperBanana生成的论文插图对比如下：

综合评估显示，PaperBanana在美观性、简洁性与逻辑清晰度上均全面优于原版。

而且它还能直接优化人工绘制的插图，瞅瞅右边，是不是高级感一下就上去了。

此外，由于PaperBanana还提供代码出图功能（即利用Gemini-3-Pro自动生成并执行Python可视化代码出图），所以它还能用来生成需要数值100%精准的各种图表。

好好好，既能拿捏高级感，又不忘精准度，应该没有学术人不爱吧~

论文作者表示，PaperBanana为全自动生成可用于出版的插图铺平了道路。

我们希望这个框架能成为连接复杂科学概念与高效视觉叙事的桥梁，赋能每一位研究者，用专业级的视觉语言清晰呈现其发现。

而在看到其效果之后，一众网友也纷纷感叹“学术插图”这个老大难总算是要被攻克了。

想想以前的日子，真真是要落泪了~

研究人员花费4个小时在Figma中绘制一张图，简直令人难以置信。

那么，学术版PaperBanana是如何炼造的呢？

一个不够，那就5个！

用一个模型生图怎么够，现在都是多智能体齐上阵了。

没错，PaperBanana背后就是5个分工明确的智能体在起作用。

Retriever Agent（检索智能体）：从顶会论文库中，找到与你要画的图领域、结构最相似的参考案例。
Planner Agent（规划智能体）：把论文文字描述，转化为包含所有模块、逻辑的详细绘图说明书。
Stylist Agent（风格智能体）：总结学术审美规范，给说明书加上配色、排版等“美颜”标准。
Visualizer Agent（可视化智能体）：根据说明书，直接画图或写代码出图，产出初稿。
Critic Agent（批判智能体）：检查图的对错与美观度，提出修改意见，循环迭代3轮优化。

下面这张图清晰展示了它们的工作流程：

划重点，连这张图也是PaperBanana自己生成的。

论文作者表示，这一过程参考了人类制作论文插图的流程。

以制作一个模型架构图为例，通常研究人员会先去看看顶会里类似工作的图是怎么画的，找找灵感和规范。

这一步就对应了检索智能体的工作。

然后就需要根据参考来规划自己的图该怎么画，“我的方法有几个关键模块？”、“数据流和逻辑顺序是怎样的？”，在想清所有关键问题后，脑子里大概就有一幅架构蓝图了。

而到这一步还不是真正动笔的时候，因为还需要结合自己的图以及之前看过的“顶会审美”标准，来给蓝图加点设计感。

有了这两样东西（蓝图+审美），现在就可以真正出图了。

并且出完之后，研究人员往往还需要检查一番，以确保出图正确无误。

怎么样？是不是一环扣一环、且全都一一对应上了。

而在了解完PaperBanana的工作方式后，接下来的问题在于：

怎么评估PaperBanana的生图效果？

实验方法及结果

对此，团队还专门构建了一个PaperBananaBench。该基准内容源自NeurIPS 2025——

他们从5275篇论文中随机采样2000篇，经过滤、人工校验后，得到584个有效样本，然后将其均分为292个测试样本和292个参考样本。

这292个参考样本，每一个都提取了完整的（S, C, I）三元组：

S（源上下文）：描述方法的文本，如论文方法论章节；
C（传达意图）：图的标题/说明，如“我们的框架概述”；
I（参考图像）：论文中实际使用的、高质量的对应图表。

参考样本集构成了一个高质量的“学术插图数据库”，主要供检索智能体进行查询和匹配。

而与之对应的292个测试样本，在评估时则仅提供S、C作为输入。其对应的I作为隐藏的标准答案，不参与生成过程，仅用于最终的质量比对与评分。

准备到这里，接下来就是具体生成和评估了。

裁判方面，他们采用了“VLM-as-a-Judge”（大模型当裁判）的评估范式——

让强大的视觉语言模型（如Gemini-3-Pro）作为评委，将PaperBanana生成的图与测试集中隐藏的标准答案I进行逐项对比。

对比的维度主要有四个：忠实性、简洁性、可读性、美观性。

若PaperBanana表现优于标准图得100分，劣于得0分，持平得50分，最终计算总分。

而实验结果表明，PaperBanana在所有维度上全面超越了传统的单模型直接生成（Vanilla）等基线方法。

整体性能碾压：总分相对基线提升了17.0%。其中，简洁性提升最为显著，高达37.2%，说明它生成的图逻辑更干净、重点更突出；可读性（+12.9%）和美观性（+6.6%）也有大幅领先。
获得人类盲测认可：在匿名的人类盲测中，研究员有72.7%的情况认为PaperBanana生成的图比基线模型更好。
统计图表表现优异：在需要高精度的统计图表任务中，PaperBanana的“代码生成模式”在数值忠实性上与人类水平相当，而简洁性和美观性甚至略胜一筹。

这里需要说明，在生成图表方面，PaperBanana有两种模式：

一种是代码生成模式（默认）。让Gemini-3-Pro这类模型自动写Python可视化代码（如Matplotlib），再运行代码出图。优点是可以保证数值绝对准确，适合需要严格精度的场景。

另一种是直接生图模式（可选方式）。跳过代码，让图像生成模型直接根据文本描述生成图表。优点是视觉效果更顶，但数值容易出现幻觉问题。

左图直接生图模式下，红框圈选出来的就是一些错误问题，而右侧的代码生图模式明显无误，但美观度略逊。

最后的消融实验证明，检索参考、风格优化、批判迭代这三个环节缺一不可，它们共同保证了最终图像的“准确”与“好看”。

不过也需要提醒，PaperBanana目前仍有一些局限性，比如它作为生图还无法编辑，同时在很多细节忠实度方面仍比不上人类手工作业。

所以，更保险的做法或许是，让它帮你优化以前绘制过的图。

在下面这套“手图蜕变”流程下，很多图都能变得更美观、更高级……当然也更容易入顶会的眼（doge）。

谷歌x北大联手打造

最后介绍下PaperBanana背后的团队。

一共7人，可以清晰分成两拨——

一拨来自北大，主要提供NLP与多模态理解的学术根基；另一拨来自Google Cloud AI Research，负责多模态系统与工业化视角。

署名第一的Dawei Zhu（兼通讯作者），本硕博均就读于北大，现为北大四年级博士生。

他重点研究长上下文建模和多模态数据，之前在微软亚洲研究院实习过，目前是Google Cloud AI Research学生研究员，PaperBanana也是他在谷歌期间参与的项目。

借着北大这条线，另外两位来自北大的分别是Xiyu Wei和Sujian Li（兼通讯作者）。

Sujian Li目前是北大计算机学院长聘副教授，也是Dawei Zhu的博导，主要研究自然语言处理、信息抽取等。

而Xiyu Wei可能还是学生，目前只能看到TA和Dawei Zhu合作过一篇关于拓展上下文的论文。

而其他几位来自Google Cloud AI Research的分别是：

负责人Tomas Pfister、高级研究科学家Yale Song、研究科学家Rui Meng和Jinsung Yoon（兼通讯作者）。

截至目前，PaperBanana已在开源社区GitHub揽获上千star，感兴趣可以继续关注。

项目主页：
https://dwzhu-pku.github.io/PaperBanana/
论文：
https://arxiv.org/abs/2601.23265
GitHub地址：
https://github.com/dwzhu-pku/PaperBanana

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

兽医给中暑的小猪打针，生动上演相对静止、绝对运动

江西晨报 2026-07-13 21:22:45
295 跟贴 295
国产“三蹦子”佛得角走红，国内厂商：一年出口200多台，销量逐年上涨

上游新闻 2026-07-14 08:11:17
1919 跟贴 1919

46万元新车到手4小时就故障了！杭州奔驰车主提车当天方向盘三次卡死，厂家拒绝退换车，“只需升级软件”

都市快报橙柿互动 2026-07-14 15:26:19
1078 跟贴 1078

事关房子、车子、收入、假期未来5年将有这些变化

大象新闻 2026-07-13 21:34:22
1041 跟贴 1041
女子参加家政培训拿到4个证书，上网却查无此证，七年后欲退款，负责人：无理取闹

极目新闻 2026-07-13 21:43:02
1200 跟贴 1200

河南商人在河北投资办学，2100万元建设的校舍竟成“违章建筑”

大风新闻 2026-07-14 16:25:09
34 跟贴 34

媒体：10年了14国还在拿一张废纸恫吓中国太荒诞了

北京日报 2026-07-13 22:55:14
384 跟贴 384
湖北农业发展集团有限公司原总经理陈华志接受审查调查

界面新闻 2026-07-14 15:01:38
33 跟贴 33

又一轮“霍尔木兹决战”，打响了

中国新闻周刊 2026-07-14 17:56:35
29 跟贴 29
7月16日至7月17日，上海这些区域将采取临时交通管制措施

纵相新闻 2026-07-14 12:50:08
43 跟贴 43
哈兰德手抱“浣熊标本”随队回国，球队全程战机护航，王储亲自擂鼓，9万人划船迎接

封面新闻 2026-07-14 13:19:04
19 跟贴 19
乌军公布视频：无人艇抢滩登陆成功，机器人自主下船登上俄控海岸

红星新闻 2026-07-14 18:58:17
2 跟贴 2
Shams：距离詹姆斯做出决定越来越近正在五队之间做决定

北青网-北京青年报 2026-07-14 09:10:34
304 跟贴 304
一辆特斯拉到底能开多少年？特斯拉官方回应

齐鲁壹点 2026-07-14 17:24:53
14 跟贴 14
收费万元，“90％以上都是糊弄”？

中国新闻周刊 2026-07-14 11:15:13
45 跟贴 45
乐事吃出“蓝色薯片”！消费者直呼“不敢吃了” 品牌方回应：希望取回产品作内部核查

闪电新闻 2026-07-14 10:06:44
47 跟贴 47
开拓者队友盛赞杨瀚森：很有天赋，他的英语进步非常大

文汇报 2026-07-14 18:10:08
36 跟贴 36
创纪录！比亚迪荣获5项国家科学技术奖｜快讯

封面新闻 2026-07-14 11:18:08
119 跟贴 119
两部门提示警惕借保险客户旅游等名义侵害消费者权益

新华社 2026-07-14 20:29:05
0 跟贴 0
姜萍近况曝光！比赛作假被取消成绩后，她走上了一条意想不到的路

她时尚丫 2026-07-14 20:34:26
0 跟贴 0
巴黎多处知名景点：缩短开放时间；有中国游客透露：高温影响行程，改成瞎溜达

南方都市报 2026-07-14 20:05:15
0 跟贴 0
民生无小事丨莫让“影子账号”骗捐透支社会信任

中国网 2026-07-14 20:34:13
0 跟贴 0
有人在昆明街头撒钱？记者实地走访

8099999街头巷尾 2026-07-14 20:33:10
0 跟贴 0

短尾蝮，我国伤人最多的蛇，它毒性有多强？一般哪里会遇到它？

短尾蝮，我国伤人最多的蛇，它毒性有多强？一般哪里会遇到它？

农夫也疯狂

2026-07-13 09:17:17

发生性关系，是女人吃亏了吗？

那年秋天

2026-07-12 11:49:12

退路被堵死，柬埔寨国王妥协了，坐拥顶级皇宫，连拒绝签字都不敢

退路被堵死，柬埔寨国王妥协了，坐拥顶级皇宫，连拒绝签字都不敢

黑鹰观军事

2026-07-09 14:12:46

人类史上几乎没有哪一位领袖，能像斯大林这样，对自己身边的同僚和战友，展开如此彻底的清洗

人类史上几乎没有哪一位领袖，能像斯大林这样，对自己身边的同僚和战友，展开如此彻底的清洗

人生录

2026-07-10 16:42:29

是谁下令轰炸中国大使馆？克林顿在自传中揭露真相，有何隐情

是谁下令轰炸中国大使馆？克林顿在自传中揭露真相，有何隐情

旧史新谭

2026-07-06 08:27:40

阿根廷获准佩戴黑纱出战世界杯，法国队要求被FIFA驳回

阿根廷获准佩戴黑纱出战世界杯，法国队要求被FIFA驳回

无意争春

2026-07-14 15:31:47

蒋方舟的雷，还没爆完！

麦杰逊

2026-07-14 19:25:51

赫子铭终于敢晒老婆了！比何洁柔和旺夫，丰腴贵气超有福气

赫子铭终于敢晒老婆了！比何洁柔和旺夫，丰腴贵气超有福气

老好人的愤怒

2026-07-14 13:40:50

世界杯：法国VS西班牙，半决赛第一场，往往逃不出这个套路？

世界杯：法国VS西班牙，半决赛第一场，往往逃不出这个套路？

林子说事

2026-07-14 17:00:32

甜馨也去夏校了！普通人看清现实：原来这就是我们跟有钱人的差距

甜馨也去夏校了！普通人看清现实：原来这就是我们跟有钱人的差距

妍妍教育日记

2026-07-14 12:30:08

2场输4分！女篮首战美国，19岁2米26新星53+22，WNBA双塔未归

2场输4分！女篮首战美国，19岁2米26新星53+22，WNBA双塔未归

刘哥谈体育

2026-07-14 11:23:49

母亲将聋哑女儿丢在悬崖，20年后其儿子上山砍柴，看见姐姐后傻眼

母亲将聋哑女儿丢在悬崖，20年后其儿子上山砍柴，看见姐姐后傻眼

古怪奇谈录

2025-08-30 11:50:18

又来这一套！中国刚约见完驻日公使，日本前大使就呼吁恢复对话

又来这一套！中国刚约见完驻日公使，日本前大使就呼吁恢复对话

牛锅巴小钒

2026-07-14 19:51:21

31岁妮可拉暴瘦不足90斤，芭蕾片场照曝光骨瘦如柴引人心疼！

31岁妮可拉暴瘦不足90斤，芭蕾片场照曝光骨瘦如柴引人心疼！

橙星文娱

2026-07-14 10:20:46

北京大妈公交车上打晕患癌姑娘，一巴掌断送退休后的美好幸福生活

北京大妈公交车上打晕患癌姑娘，一巴掌断送退休后的美好幸福生活

嘉琪Feel

2025-07-09 23:05:01

还是来了，中方明确拒绝巴方请求，中国网友：亲兄弟也得明算账！

还是来了，中方明确拒绝巴方请求，中国网友：亲兄弟也得明算账！

离离言几许

2026-07-14 17:00:30

把瑜伽裤穿成日常的松弛感美女

只要高兴就好

2026-04-13 14:30:30

朝鲜：绝不姑息北约盟国及其伙伴公开鼓动对抗行为将加速积蓄实力以阻止对抗企图

朝鲜：绝不姑息北约盟国及其伙伴公开鼓动对抗行为将加速积蓄实力以阻止对抗企图

每日经济新闻

2026-07-12 09:13:36

李诚儒躲不过去了！功夫女足票房大爆，他和周星驰6年前恩怨被扒

李诚儒躲不过去了！功夫女足票房大爆，他和周星驰6年前恩怨被扒

动物奇奇怪怪

2026-07-14 14:49:44

他是国军总司令，毛主席唯独不接受他投降，老蒋：我也想杀了他

他是国军总司令，毛主席唯独不接受他投降，老蒋：我也想杀了他

铜臭的历史味

2026-06-27 04:23:20

追踪人工智能动态

12949文章数 176518关注度

往期回顾全部

科技要闻

AI失业风险正在逼近 "我们连未来都看不清"

头条要闻

外交部发言人连说三个"不会" 驳所谓"南海仲裁案"谬论

头条要闻

外交部发言人连说三个"不会" 驳所谓"南海仲裁案"谬论

体育要闻

33岁成为法国主力，他将在世界杯防守亚马尔

娱乐要闻

施南生离世，成龙、甄子丹等发文悼念

财经要闻

为什么说智谱是中国版Anthropic是伪命题

汽车要闻

激光雷达+智舱看吉利星瑞L PLUS如何让燃油车也更智能

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

数码

家居

健康

教育

房产要闻

三亚湾，最魔幻豪宅项目曝光！

数码要闻

iQOO TWS 5e耳机开启预约：50hr续航、42ms全链路延迟

家居要闻

2026建博会(广州) 公装联探展交流活动

高血压为何会导致中风高发？

教育要闻

什么是成功的父母？你只要做到这一件事！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版