网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌推出自动生成学术插图的开源框架：PaperBanana，搞科研的别错过

2026-02-09 12:53:15　来源: 侃故事的阿庆

福建举报

0

分享至

做科研的兄弟们都知道，写论文最痛苦的环节往往不是敲代码，而是画图。

为了画一张这就“高大上”的Methodology（方法论）架构图，你可能要在 Visio、PowerPoint、甚至 Adobe Illustrator 之间反复横跳。

配色要高级，线条要对齐，逻辑要清晰——往往一整天过去了，图还没改好，心态先崩了。

最近，北大（PKU）联合 Google Research 推出的一个名为 PaperBanana 的项目在 GitHub 上还未开源就收获了2.9k的关注。

对，还没开源，官方说还有2周~好饭不怕晚，我们再等等！

官方号称它是一个智能体框架，能直接把你的文字描述转化成出版级的学术插图！

PaperBanana怎么做到的？

PaperBanana的解法，五个智能体协作

PaperBanana的核心思想很简单，用AI智能体来完成论文配图的全流程。

但它不是简单地"给个prompt就生成图片"，而是设计了五个专门的智能体，各司其职：

Retriever Agent（检索者）：先去搜相关的参考图

画图之前，得先看看别人怎么画同类方法的。比如你做的是Transformer变体，它就去搜NeurIPS、ICML这些顶会里类似的方法图，作为参考。

Planner Agent（规划者）：把你的方法转换成详细的文字描述

这是整个框架的"大脑"。它需要读懂你的论文正文、图表说明，然后规划出一套详细的画图方案：这里要画几个框？用什么颜色？标签怎么写？

这个过程其实是在做"视觉化思考"——把抽象的方法变成具体的画面描述。这个过程本身就有价值，因为你在思考"怎么表达"的时候，其实也在梳理自己的思路。

Stylist Agent（风格师）：确保符合学术审美

它会从检索到的参考图里提取风格规则：用什么配色方案？字体用多大？间距怎么控制？阴影怎么加？

这些细节决定了图表最终的专业感。

Visualizer Agent（视觉化者）：把描述变成图片或代码

这是执行层。根据前面的规划，要么直接生成图片，要么生成代码（比如Matplotlib、Plotly的代码）。

Critic Agent（批评者）：自我检查和迭代

生成完不等于结束。Critic会检查：这个图准确吗？简洁吗？美观吗？如果不行，就反馈给前面的智能体重新做。

这五个智能体串起来，就是一个完整的"思考-规划-执行-检查"闭环。

怎么评估好不好？

很多论文会说"我们的方法很好"，但没有量化指标。

PaperBanana团队做了一个很重要的事情：建了一个评测基准，叫PaperBananaBench。

他们从NeurIPS 2025的论文里，手工筛选了292个真实的方法论图作为测试集。覆盖了计算机视觉、NLP、强化学习等不同领域，也包括了不同风格的图表。

结果显示，PaperBanana在这四个维度上都显著优于基线方法。

这个数据还挺猛的。我原本以为提升也就10-20%，没想到是全面领先。

更重要的是，他们不只是画方法图，还能画统计图表（比如柱状图、折线图）。下面这个柱状图就是官方给的例子

两个有趣的应用场景

论文里提到了两个额外的应用，我觉得挺有意思。

场景一：优化人类画好的图

你可能遇到过这种情况：自己画的图内容是对的，但配色、字体、布局不太专业。

PaperBanana可以先"学习"学术图表的美学规范，然后用这些规则去优化你已有的图。

论文里有个对比示例：原始图是作者手画的，信息准确但配色有点老气。经过优化后，颜色更现代，字体更统一，整体感觉专业了很多。

场景二：用图像生成模型画统计图

传统的统计图都是用代码（Matplotlib、Seaborn）生成的，优点是准确，缺点是不好看。

PaperBanana尝试用图像生成模型（比如DALL-E、Midjourney这一类）直接生成统计图。

结果发现了一个有趣的trade-off：

图像生成的图表更美观、更有设计感

但准确度不如代码生成，容易出现数字错误、元素重复等问题

这个结论挺真实的。图像生成模型在"看起来好看"上很强，但在"数值准确"上确实有局限。

官方还给了对比例子，别的不多说了，大家看下哪个更好

但它还做不到什么？

当然，PaperBanana也不是完美的。

论文里坦诚地列出了主要的失败案例：连接错误。

比如该连的没连，连错目标节点，或者有多余的连线。这些问题，Critic智能体有时候也识别不出来。

初步分析认为，这可能和基础模型本身的感知能力有关——有些视觉关系，模型就是看不出来。

除此之外，还有一些现实的限制：

生成速度：五个智能体串起来，一次迭代可能要几分钟。如果是复杂图表，需要多次迭代，时间成本还是有的

领域限制：目前主要针对AI领域的论文，其他学科（比如生物、物理）的图表，可能需要重新训练

风格局限：虽然能学习参考图风格，但如果目标风格和训练数据差异太大，效果会打折

所以，现在的PaperBanana更像是一个"助手"，而不是"替代品"。

它可以帮你快速生成初稿，但最终的微调、校验，还需要人来把关。

题外话了，每日一感慨

PaperBanana这类工具的出现，让研究者可以把更多时间花在真正的"思考"上，而不是"制图"上。

类比一下编程领域：现在有Trae、Cursor、CodeX、Claude Code这些AI编程助手，让程序员效率大大提高，很多编码都是有AI来完成了。

PaperBanana对学术写作，可能也会起到类似的作用。

再往后的未来，学术研究中的很多体力活，以前需要大量人力精力的，可能都会有AI来完成。所有能够流程化，逻辑确定的内容都可以AI来搞定了！AI注定要重塑科研的工作流程！

项目仓库（还没开源，先关注下，春节后估计就放出来了）

https://github.com/dwzhu-pku/PaperBanana

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

编程已死，键盘长草！Claude Code之父对谈Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
51 跟贴 51
神秘模型「Pony Alpha」火了，被曝是GLM-5

量子位 2026-02-09 14:56:43
2 跟贴 2

编程AI变天了！实测神秘模型Pony Alpha：Opus级智能，架构师思维上线

智东西 2026-02-09 17:05:11
1 跟贴 1

CMU开源首份Agentic Search日志数据，把Agent拆开给你看

机器之心Pro 2026-02-09 12:05:13
0 跟贴 0
视频模型的两条河流：字节跳动Seedance与OpenAI的分岔

钛媒体APP 2026-02-09 21:20:06
0 跟贴 0

狂砸4万亿！美国四巨头“流血”搞AI，苹果：溜了溜了

智东西 2026-02-09 20:26:20
0 跟贴 0

DeepMind负责人：2036 AI意识觉醒？LeCun怒怼：LLM路线全错！

新智元 2025-12-16 16:55:25
0 跟贴 0
谷歌前CEO施密特：现在想赚钱非常简单！

知了3C 2026-02-07 21:53:13
0 跟贴 0

下一代谷歌头显，XREAL x Google 定义混合现实头显

爱范儿 2025-12-10 05:12:08
0 跟贴 0
DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0
机器人进汽车厂，给波士顿动力，装上谷歌最强大脑

机器之心Pro 2026-01-06 19:02:05
0 跟贴 0
登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

机器之心Pro 2026-02-09 12:16:39
0 跟贴 0
凌晨三点，彻底失眠：Seedance 2.0告诉我们，AI对现实世界工作流“压缩”正在加速

华尔街见闻官方 2026-02-09 07:57:50
27 跟贴 27
ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

机器之心Pro 2026-02-09 12:26:23
0 跟贴 0
解放军报：腐败存量尚未彻底清除！军事不过硬一打就垮，政治不过硬不打自垮

究竟视频 2026-02-09 16:46:51
2 跟贴 2
向量数据库在AI时代，价值几何？| 0208

虎嗅APP 2026-02-09 06:19:08
1 跟贴 1
CVPR 2026 Workshop征稿第六届AdvML@CV：多模态大模型智能体安全

机器之心Pro 2026-02-09 14:21:00
0 跟贴 0
5亿买一个域名，这个币圈狠人，想让你60秒拥有自己的AI贾维斯

新智元 2026-02-09 16:29:59
0 跟贴 0
马斯克：最便宜的AI算力在太空，每年至少发射1万次，人形机器人就是“印钞机”

澎湃新闻 2026-02-09 16:10:19
130 跟贴 130
全新视角看世界模型：从视频生成迈向通用世界模拟器

机器之心Pro 2026-02-09 12:55:00
0 跟贴 0
Seedance2.0 对AI应用意味着什么？

华尔街见闻官方 2026-02-09 20:59:23
0 跟贴 0
冯骥直称“地表最强”、Tim 连呼6次“恐怖”，字节跳动Seedance 2.0的AI狂欢与“信任”风暴

每日经济新闻 2026-02-09 22:11:04
0 跟贴 0
29元韭菜炒蚌壳肉吃出粉色珍珠？网友直呼新年好运，门店：情况少见，可免费拿走

极目新闻 2026-02-07 12:54:35
2510 跟贴 2510
这个台湾小伙了不起：头脑清醒，思维逻辑清晰，说出两岸人民心声

美人爱数码 2026-02-09 15:26:05
0 跟贴 0
川大导师威胁，敢管就报复，卖房带经费回日！校方：已启动调查

米果说识 2026-02-09 19:54:49
0 跟贴 0
车子后窗的字体，原来有些是手写上去，师傅妥妥的手艺人！

鸭嘴爱搞笑 2026-02-09 11:26:22
1 跟贴 1
美股最新评级｜华泰证券维持谷歌-A“买入”评级，目标价415美元

财联社 2026-02-09 16:57:04
0 跟贴 0
MiniMax来承包你的桌面了-4

机器之心Pro 2026-01-20 20:19:42
0 跟贴 0
全球排名洗牌：中国高校凭什么超越哈佛？

新浪财经 2026-02-09 19:07:05
1 跟贴 1
俄外长：若欧洲国家发动攻击俄方将用一切手段进行军事回应

环球网资讯 2026-02-09 06:15:27
2442 跟贴 2442
美国IPO市场强势复苏！高盛：募资规模2026年将飙升至1600亿美元

财联社 2026-02-09 22:06:19
0 跟贴 0
语音问一问上线，小红书为何发力问搜？

36氪 2026-02-09 21:41:10
0 跟贴 0
科学选材方法论，矛叔详解“心率恢复测试”#李矛教练 #羽毛球

郑方超羽毛球 2026-02-05 12:58:55
15 跟贴 15
智能体基础设施是AI时代操作系统，真正的智能体要能思考、能分析，能行动

量子位 2025-12-11 03:38:22
1 跟贴 1
大鹅与乌冲突升级：无人机被击落，平民遇难，战争逻辑再显

花魄m 2026-02-08 02:38:43
0 跟贴 0
购房逻辑，需求排序，看房之前想清楚

老薛的直播日常 2026-02-05 13:38:14
0 跟贴 0
ApdativeNN：建模类人自适应感知机制，突破机器视觉不可能三角

机器之心Pro 2025-11-28 17:15:19
0 跟贴 0
严肃版AI编程助手 GitHub星标3k+

量子位 2025-12-08 15:29:06
0 跟贴 0
Claude Code之父，推特亲传使用技巧，超 500 万人关注

机器之心Pro 2026-01-05 13:26:18
0 跟贴 0
开源AI编程工具CoStrict，GitHub星标3K+

量子位 2025-12-09 01:52:08
0 跟贴 0

丘成桐：要不是我牛逼，早被那帮人整垮

丘成桐：要不是我牛逼，早被那帮人整垮

深度报

2026-02-07 23:19:01

姜武一家住北京四合院豪气，和儿子一起挂灯笼，妻子女儿出镜漂亮

姜武一家住北京四合院豪气，和儿子一起挂灯笼，妻子女儿出镜漂亮

娱说瑜悦

2026-02-09 17:51:41

2026时来运转？香港著名堪舆学家苏民峰，深度解析12生肖运程

2026时来运转？香港著名堪舆学家苏民峰，深度解析12生肖运程

港港地

2026-02-09 10:03:43

中国将出席“和平委员会”首次领导人会议吗？外交部回应

中国将出席“和平委员会”首次领导人会议吗？外交部回应

澎湃新闻

2026-02-09 15:53:05

险胜！弗拉格34+12，阿门轰21+8+9，你再打下去，就是火箭新领袖

险胜！弗拉格34+12，阿门轰21+8+9，你再打下去，就是火箭新领袖

巴叔GO聊体育

2026-02-09 15:59:20

一马尔代夫球队输4球将降级，于是选择弃赛被判0-3顺利保级

一马尔代夫球队输4球将降级，于是选择弃赛被判0-3顺利保级

懂球帝

2026-02-09 15:17:24

安徽大众1年亏损43亿！年销仅9千辆！不及上汽大众1%

安徽大众1年亏损43亿！年销仅9千辆！不及上汽大众1%

网上车市

2026-02-08 01:42:42

一反常态！仅完成一笔交易、一笔签约，这队已完成阵容修整！

一反常态！仅完成一笔交易、一笔签约，这队已完成阵容修整！

大卫的篮球故事

2026-02-08 21:35:08

单身多年生活潇洒，哥哥王刚家中永远为她留着位置，亲情胜过一切

单身多年生活潇洒，哥哥王刚家中永远为她留着位置，亲情胜过一切

白面书誏

2026-02-09 12:44:23

4枪已开打，特朗普收割中国资产，还逼中方交出武器，俄希望谈判

4枪已开打，特朗普收割中国资产，还逼中方交出武器，俄希望谈判

墨兰史书

2026-02-06 09:30:08

娱乐圈太现实，曾经的当红流量小花，参加微博之夜，竟全程没镜头

娱乐圈太现实，曾经的当红流量小花，参加微博之夜，竟全程没镜头

楚楚号

2026-02-07 07:14:47

全世界没搞成的事，中国搞成了

牛弹琴

2026-02-09 06:15:27

“最惨”高考生陈亮：母亲、哥哥相继去世，高考前一天父亲也没了

“最惨”高考生陈亮：母亲、哥哥相继去世，高考前一天父亲也没了

未来已来风云变幻

2026-02-09 09:33:04

豪车价格战，迪A3跌破10万，消费者还买单吗？

豪车价格战，迪A3跌破10万，消费者还买单吗？

燕梳楼频道

2026-02-08 21:34:04

外媒：澳大利亚悉尼、墨尔本等多地爆发示威活动，数千人集会抗议以色列总统到访

外媒：澳大利亚悉尼、墨尔本等多地爆发示威活动，数千人集会抗议以色列总统到访

环球网资讯

2026-02-09 21:53:09

随着CBA杯上海112:83大胜上海，我发现三个不得不说的事实！

随着CBA杯上海112:83大胜上海，我发现三个不得不说的事实！

田先生篮球

2026-02-08 22:58:05

年薪30万男友因工资卡分手，婚姻最毒的算计是“我要全部掌控”

年薪30万男友因工资卡分手，婚姻最毒的算计是“我要全部掌控”

戗词夺理

2026-02-08 10:55:45

沪媒：申花明天很可能三外援前锋同时首发，门将应该是薛庆浩

沪媒：申花明天很可能三外援前锋同时首发，门将应该是薛庆浩

懂球帝

2026-02-09 18:39:06

93年毛远新出狱，看到长相出众的女儿很欣慰，得知残疾又泣不成声

93年毛远新出狱，看到长相出众的女儿很欣慰，得知残疾又泣不成声

雍亲王府

2026-02-08 18:15:07

NBA官宣三分赛名单：两届冠军利拉德意外入选米切尔克努佩尔在列

NBA官宣三分赛名单：两届冠军利拉德意外入选米切尔克努佩尔在列

罗说NBA

2026-02-09 04:47:45

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

376文章数 7574关注度

往期回顾全部

科技要闻

实测|字节新模型带着音效和复杂运镜杀疯了

头条要闻

高市早苗表态：着手推动修宪

头条要闻

高市早苗表态：着手推动修宪

体育要闻

创中国冬奥最佳战绩！19岁速滑新星含泪向天拉勾

娱乐要闻

央视电影活动名场面！明星站位太讲究

财经要闻

沪深北交易所优化再融资释放3个信号

汽车要闻

长安将搭钠电池好比汽车要装柴油机？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

时尚

家居

房产

军事航空

本地新闻

围观了北京第一届黑色羽绒服大赛，我笑疯了

冬季穿衣越简单越实用！从这些日常穿搭中收获灵感，大方又自然

家居要闻

山院焕新雅聚悦亲朋

房产要闻

海南又一千亿级赛道出现，京东、华润、中石化等巨头率先杀入！

军事要闻

美伊最敏感时刻林肯号航母迎来三位“不速之客”

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版