网易首页 > 网易号 > 正文 申请入驻

学术插图新神器!万字材料秒出SVG,西湖大学出品 | ICLR'26

0
分享至

AutoFigure团队 投稿
量子位 | 公众号 QbitAI

你是否也经历过这样的绝望:

论文截稿在即,面对大段的文字你抓耳挠腮,PPT画框画到手抽筋;

尝试用Nano banana生个图,颜值拉满但逻辑全错,甚至还自带“克苏鲁”风格的模糊字符;

^好不容易调好了Prompt,结果想改一个小图标,却发现AI给你的只是一张无从下手的“死图”。

这种“审美与逻辑不可兼得、生成与编辑彻底断层”的痛点,终于要被终结了。

现在,你可以把大段的文字材料直接塞给AutoFigure,西湖大学团队推出的全新智能体绘图框架



它能够一键读懂上万字的论文、书籍、博客,自动化地吐出高质量的学术插图为你所用。

更重磅的是,其优化版本AutoFigure-Edit实现了从“像素”到“矢量”的跨越:生成的插图不再是死板的图片png,而是细节可编辑的SVG文件(现在你可以在PPT里直接编辑了)。

目前,该工作已入选ICLR 2026。代码、数据集、Web交互界面全部开源,并同步上线了可一键使用的在线网站



背景:为什么AI以前画不好科学插图?

在学术绘图界,一直存在两个极端:

1. End-to-end派(如GPT-Image):审美在线,但逻辑经常“蹦迪”,文字更是重灾区,充满了莫名其妙的幻觉字符。

2. Text-to-code派(如TikZ/SVG生成):逻辑倒是严密,但视觉效果往往丑得像上个世纪的教科书,缺乏现代论文的高级感。

AutoFigure提出了“推理式渲染”(Reasoned Rendering)范式:将“脑子(逻辑布局)”和“手(美化渲染)”彻底分开。

技术方案:模拟大牛设计师的“三步走”策略

AutoFigure的核心是一个分工明确的多智能体协作系统。



△AutoFigure架构图(由AutoFigure生成,未经修改)

第一步:Conceptual Grounding(构建逻辑骨架)

AI读入你长达万词的文字材料,自动提取实体和关系,生成一个粗糙但结构正确的布局(SVG/HTML代码)

第二步:Critique-and-Refine(Agent闭环迭代)

模拟人类设计师与甲方的反复拉锯,对图片布局进行反复修改:

  • AI Designer负责根据反馈修改布局。
  • AI Critic则负责挑毛病(例如“这里箭头重叠了”、“布局重心不稳”),直到得到满意的绘图质量。
第三步:Aesthetic Rendering & “Erase-and-Correct”

在最终美化阶段,AutoFigure首先将布局渲染为一张精美的图片。随后,为了解决现在AIGC生图文字变形的问题,保证图片中文字的正确性,AutoFigure引入了专门的“擦除-修正”策略:用OCR识别模糊字符,把它们“抠掉”,再重新覆盖上清晰的矢量文本。

AutoFigure-Edit:把AI生成图装进PPT



△AutoFigure-Edit流程图(由AutoFigure-Edit生成)

在最新版本AutoFigure-Edit中,西湖大学团队更进一步,引入了SAM3自动抠图技术,包括:

  • 利用Meta最新的SAM3技术识别图中的Icon。
  • 配合RMBG-2.0自动去除背景。
  • 矢量重组:将这些干净的图标重新塞进生成的SVG模板中。

最终,你得到的是一个可以在浏览器内置编辑器里直接拖拽、改字、换色的动态画布,能够按照你的想法对图片细节进行更改。



△基于AutoFigure-Edit的在线画布



△AutoFigure-Edit渲染过程示例图

人类实验结果:66.7%的专家觉得它达到了Camera-ready标准!

为了验证AutoFigure的效果,团队构建了全球首个大规模科学插图基准——FigureBench

规模宏大:涵盖3,300高质量文本-图片对,跨越论文、综述、技术博客、教科书等四种科学文本。



△FigureBench数据集介绍

降维打击:在逻辑清晰度和准确度上,AutoFigure的优势极大,在教科书类任务中胜率甚至高达97.5%



△在FigureBench上的实验结果

更具说服力的是人类专家盲测:10位论文一作对生成的图片进行评审,结果显示66.7%的专家认为AutoFigure生成的图已经达到了Camera-ready(出版级)标准。



△人类专家评价结果

接下来,我们看几个case,直观感受一下。

由AutoFigure-Edit产生的方法图:



由AutoFigure-Edit产生的方法图:



由AutoFigure-Edit产生的方法图:



方法图,左侧为第一阶段PNG形式,右侧为最终转换得到的SVG文件:



方法图,左侧为第一阶段PNG形式,右侧为最终转换得到的SVG文件:



由AutoFigure-Edit产生的生物机制图:



由AutoFigure-Edit产生的材料机制图:



由AutoFigure产生的综述图:



由AutoFigure产生的教科书图:



项目价值:AI Scientist的“最后一块拼图”

插图不仅是视觉补充,更是复杂科学概念的桥梁。AutoFigure的出现,意味着:

1. 赋能AI科学家:这是AI实现全流程自主研究(从文本到绘图)的关键一步。

2. 不只是架构图:无论是流程图、算法流程,还是复杂的教科书示意图,它都能手到擒来。

本项目提供了可一键使用的在线网站。建议各位研究者先收藏,下次ddl前,起码画图应该不会那么仓促了。

GitHub:

https://github.com/ResearAI/AutoFigure-Edit
论文:

https://arxiv.org/abs/2602.03828v1
HuggingFace:

https://huggingface.co/datasets/WestlakeNLP/FigureBench
网站:

https://deepscientist.cc
彩蛋:

所有学者均可免费体验demo,有期刊投稿需求的朋友不用担心,Nature风格、Science风格等多样风格一键生成功能也将很快上线。

想要体验这款“绘图神器”吗?点击上方链接即可开始你的创作!

本项目由西湖大学张岳实验室全面开源。西湖大学自然语言处理实验室(WestlakeNLP)成立于2018年9月,由张岳教授领导。张岳教授毕业于牛津大学,获博士学位,现任西湖大学工程学院副院长。他著有剑桥大学出版社出版的《自然语言处理》一书,并担任过EMNLP 2022等多个顶级NLP会议的程序委员会主席。

本项目核心团队成员包括翁诣轩*、林圳、朱敏郡、谢秋婕、卢攀忠、孙启耀等人。实验室过往成果包括Cycle Researcher、DeepReview、DeepScientist(两个月刷新三个前沿任务SoTA的人工智能科学家项目)等工作。欢迎感兴趣的同学加入到自动化科学发现研究,有意向申请长期实习、博士生、研究助理者可联系张岳教授邮箱(zhangyue@westlake.edu.cn)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
梅艳芳102岁妈妈现身拜年,穿红衣戴翡翠精神好,月领25万生活费

梅艳芳102岁妈妈现身拜年,穿红衣戴翡翠精神好,月领25万生活费

开开森森
2026-02-22 10:37:49
林孝埈再次致歉!孙龙自责泪崩+哽咽:做了努力但是,没有办法

林孝埈再次致歉!孙龙自责泪崩+哽咽:做了努力但是,没有办法

风过乡
2026-02-22 11:52:45
谷爱凌逆袭夺第5金!最新金牌榜中国队甩开韩澳英,追上日本队

谷爱凌逆袭夺第5金!最新金牌榜中国队甩开韩澳英,追上日本队

老吴说体育
2026-02-22 19:24:01
一男童大年初五在虎跳峡坠崖不幸遇难,当地:是和爸爸奶奶一起来游玩的,事发地系未开放区域,不在景区内

一男童大年初五在虎跳峡坠崖不幸遇难,当地:是和爸爸奶奶一起来游玩的,事发地系未开放区域,不在景区内

极目新闻
2026-02-22 14:31:00
冬奥会收官日,中国第5金诞生!谷爱凌大翻盘:失误后从第8升第1

冬奥会收官日,中国第5金诞生!谷爱凌大翻盘:失误后从第8升第1

侃球熊弟
2026-02-22 19:16:16
5金4银6铜!中国刷新冬奥会境外参赛纪录 奖牌总数追平北京冬奥会

5金4银6铜!中国刷新冬奥会境外参赛纪录 奖牌总数追平北京冬奥会

念洲
2026-02-22 19:16:10
随着谷爱凌夺冠!冬奥会金牌榜,中国队最终排名出炉:5金4银6铜

随着谷爱凌夺冠!冬奥会金牌榜,中国队最终排名出炉:5金4银6铜

足球评论qs
2026-02-22 19:12:35
中国队闭幕式旗手确定!宁忠岩落选原因曝光,李琰看人眼光真准

中国队闭幕式旗手确定!宁忠岩落选原因曝光,李琰看人眼光真准

何老师呀
2026-02-22 08:25:12
组委会确认!中国队夺第5金传来两个好消息,谷爱凌“因祸得福”

组委会确认!中国队夺第5金传来两个好消息,谷爱凌“因祸得福”

何老师呀
2026-02-22 07:35:00
马年春节里,为什么没什么人争论,该买油车还是买电车了

马年春节里,为什么没什么人争论,该买油车还是买电车了

路咖汽车
2026-02-20 10:36:41
中国游客遗体被打捞出,俄外长致哀

中国游客遗体被打捞出,俄外长致哀

观察者网
2026-02-22 15:35:13
中俄舰艇都到了,美军还打不打伊朗?特朗普摊牌,一句话非比寻常

中俄舰艇都到了,美军还打不打伊朗?特朗普摊牌,一句话非比寻常

嫹笔牂牂
2026-02-21 16:24:51
不再希望理解?谷爱凌夺金后疏忽了地上的红旗,但没忘记披上国旗

不再希望理解?谷爱凌夺金后疏忽了地上的红旗,但没忘记披上国旗

真理是我亲戚
2026-02-22 19:51:59
警方通报五台山景区火情:系村民祭祀引发

警方通报五台山景区火情:系村民祭祀引发

界面新闻
2026-02-22 17:18:53
看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

火山詩话
2026-02-22 08:29:48
国家队祝贺李方慧摘银:少女终于在漫天冰雪中,长成了最从容的自己

国家队祝贺李方慧摘银:少女终于在漫天冰雪中,长成了最从容的自己

懂球帝
2026-02-22 19:49:11
伊朗要死!

伊朗要死!

求实处
2026-02-22 17:53:28
当今社会过得最舒服的几个群体,几乎享受到了所有的时代红利!

当今社会过得最舒服的几个群体,几乎享受到了所有的时代红利!

李老师讲最真教育
2026-02-21 18:58:00
不打了!男篮最强控卫退出国家队,郭士强惨遭重大打击!

不打了!男篮最强控卫退出国家队,郭士强惨遭重大打击!

绯雨儿
2026-02-22 13:27:42
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

来科点谱
2026-02-22 07:06:28
2026-02-22 21:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12189文章数 176389关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

中国第五金 谷爱凌U型场地技巧决赛夺金李方慧摘银

头条要闻

中国第五金 谷爱凌U型场地技巧决赛夺金李方慧摘银

体育要闻

自由式滑雪U型池 谷爱凌成功卫冕

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

亲子
健康
本地
家居
教育

亲子要闻

萌娃怀疑妈妈吃了个宝宝,问的妈妈哭笑不得

转头就晕的耳石症,能开车上班吗?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

本真栖居 爱暖伴流年

教育要闻

本科生,就业去哪了?

无障碍浏览 进入关怀版