网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

DeepSeek之后，清华和智谱AI提出“视觉压缩”新范式

2025-11-01 11:33:42　来源: 机器学习与Python社区

北京举报

0

分享至

大型语言模型（LLM）在处理超长上下文时面临着巨大的计算和内存成本挑战，这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案，如扩展位置编码或优化注意力机制，往往无法从根本上解决 token 序列长度带来的开销，而检索增强（RAG）方法又可能引入信息丢失和额外延迟。

核心创新：视觉-文本压缩

https://arxiv.org/abs/2510.17800

清华大学和智谱AI等机构提出的 Glyph 框架，为这一难题提供了一个极具创新性的"非对称"解决方案：

信息密度革命 ：将冗长的文本内容渲染成紧凑的图像
跨模态处理 ：利用视觉-语言模型（VLM）处理视觉化文本
效率突破 ：单个视觉token可承载3-4倍文本信息量

技术实现三阶段 1. 持续预训练

训练数据：多样化渲染文本数据集
核心目标：建立视觉符号与语义的映射关系

2. LLM驱动的渲染搜索

采用遗传算法优化参数：
- 字体样式
- 版面布局
- DPI分辨率
平衡点：压缩率 vs 模型性能

3. 后训练优化

监督微调（SFT）
强化学习（RL）
OCR辅助任务（提升文本识别精度）

实验成果

指标

提升幅度

对比基线

Token压缩率

3-4倍

传统文本token

推理速度

最高4倍

Qwen3-8B

训练效率

约2倍

常规SFT

LongBench得分

相当/超越

同级LLM

战略意义

新范式互补 ：与注意力机制优化形成技术矩阵
扩展性突破 ：为百万级token处理铺平道路
跨模态增益 ：同步提升真实场景文档理解能力

该研究预示AI系统处理超长上下文的能力即将进入新纪元，相关代码已开源。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

美国发射洲际弹道导弹俄方回应

央视新闻客户端 2025-11-06 05:35:52
13896 跟贴 13896
足协官宣 45岁邵佳一出任国足新主帅

央视新闻客户端 2025-11-05 17:36:01
13013 跟贴 13013

国务院公告后搜索暴涨3倍上海人立马出手：怕抢不到

极目新闻 2025-11-05 15:06:20
737 跟贴 737

1斤豆芽卖28.8元？网友直呼“吃不起”，知名餐饮品牌回应

都市快报橙柿互动 2025-11-02 16:20:16
8623 跟贴 8623
造价10亿地标13.6亿起拍！广州圆大厦第三次上架找买家

南方都市报 2025-11-06 11:51:15
41 跟贴 41

重庆行政区划调整撤销江北区、渝北区

央视新闻客户端 2025-11-06 12:04:05
586 跟贴 586

三亚海滩“长满”了俄罗斯人！网友调侃：我在这里反而成了“老外”

封面新闻 2025-11-02 12:57:02
148 跟贴 148
美国肯塔基州州长：本州进入紧急状态

央视新闻客户端 2025-11-06 05:30:35
726 跟贴 726

全运会|1：2不敌浙江队，山东U20男足惊险晋级八强

齐鲁壹点 2025-11-05 22:37:14
311 跟贴 311
中泰建交以来泰国国王首次访华外交部介绍访问安排

财联社 2025-11-06 15:50:03
6 跟贴 6
小鹏全新飞行汽车亮相：续航超500公里！何小鹏打出“安全牌”：高管先飞，必须飞满5000公里

每日经济新闻 2025-11-05 19:25:06
2562 跟贴 2562
境外租车加错油 “全额保险”竟失效，游客还被扣了6000元丨云求助

封面新闻 2025-11-05 19:05:03
630 跟贴 630
杨瀚森方回应近期争议：不存在暴饮暴食，食谱都是由队内专门制订，杨瀚森很珍惜征战NBA的机会

环球网资讯 2025-11-05 19:38:05
732 跟贴 732
iPhone手机半夜“自动给陌生人打电话”？苹果客服回应；苹果中国区收紧渠道严禁线下经销商线上售产品

极目新闻 2025-11-05 10:51:18
569 跟贴 569
俄士兵连遭乌军7架无人机袭击奇迹生还视频披露

红星新闻 2025-11-06 01:40:12
1028 跟贴 1028
杭州女子全款买下1800万二手精装房搬家计划要泡汤了

极目新闻 2025-11-06 11:55:49
0 跟贴 0
收评：沪指涨近1% 重返4000点

财联社 2025-11-06 15:07:06
59 跟贴 59
“青海互助县一乡镇公路刚通车就多处坑洼” 官方通报：对涉及道路坑洼等问题进行核查，对相关责任人将严肃问责

环球网资讯 2025-11-06 13:45:12
52 跟贴 52
专家最新回应“康熙生父为洪承畴”：采样过雍正第五子和恭亲王弘昼后代，DNA证实其努尔哈赤支系

扬子晚报 2025-11-06 12:13:35
0 跟贴 0

电商纳税新规来了，销售超10万必须升级个体或公司，有人直接关门

电商纳税新规来了，销售超10万必须升级个体或公司，有人直接关门

眼光很亮

2025-11-06 10:26:13

台湾用上高德地图了，它是怎么做到的？背后隐藏了哪些关键技术

台湾用上高德地图了，它是怎么做到的？背后隐藏了哪些关键技术

历史有些冷

2025-11-05 19:35:03

官宣，王曼昱或被处罚，国际乒联开罚单原因曝光，王励勤不该犯错

官宣，王曼昱或被处罚，国际乒联开罚单原因曝光，王励勤不该犯错

乐聊球

2025-11-05 14:41:44

处决吴石当天，陈诚叫停了台湾所有的死刑，究竟是怜悯还是算计

处决吴石当天，陈诚叫停了台湾所有的死刑，究竟是怜悯还是算计

小涛叨叨

2025-11-06 11:26:17

特朗普学拜登，也在裤腿里绑了尿袋，半身不遂的年纪，真是可怜

特朗普学拜登，也在裤腿里绑了尿袋，半身不遂的年纪，真是可怜

我心纵横天地间

2025-11-05 19:25:51

进了就是好球！布朗尼罚球线迎着防守中投打板命中

进了就是好球！布朗尼罚球线迎着防守中投打板命中

林子说事

2025-11-06 13:46:15

桃色大瓜！湖南省人民医院副院长与美女眼科主任的瓜

桃色大瓜！湖南省人民医院副院长与美女眼科主任的瓜

金陵隐士

2025-11-06 09:34:50

王爱和，被查

新京报政事儿

2025-11-06 12:52:41

鹿哈官宣领证不到24小时，令人担心的事接连发生，岳云鹏没说错

鹿哈官宣领证不到24小时，令人担心的事接连发生，岳云鹏没说错

白面书誏

2025-11-06 13:38:55

斯诺克最新战报！吴宜泽连战连捷，第2局零封TOP16，赵心童暂落后

斯诺克最新战报！吴宜泽连战连捷，第2局零封TOP16，赵心童暂落后

刘姚尧的文字城堡

2025-11-06 15:21:53

荷兰政府花200亿挽留无效，光刻机巨头ASML为何执意从老家搬走？

荷兰政府花200亿挽留无效，光刻机巨头ASML为何执意从老家搬走？

凡知

2025-11-06 11:38:13

国运来了挡不住！30亿吨铁矿重见天日，美媒：中国将改写全球格局

国运来了挡不住！30亿吨铁矿重见天日，美媒：中国将改写全球格局

墨兰史书

2025-11-06 07:40:03

中方重拳击阿萨德，俄美英法难以应对，朱拉尼逆流而上？

中方重拳击阿萨德，俄美英法难以应对，朱拉尼逆流而上？

林子说事

2025-11-06 06:24:48

突发！辉瑞、默沙东22款进口药退场，真相和你用药息息相关

突发！辉瑞、默沙东22款进口药退场，真相和你用药息息相关

刘哥谈体育

2025-11-06 10:39:01

中国和塔吉克斯坦没有深仇大恨，为何两国边界却一直是未定国界？

中国和塔吉克斯坦没有深仇大恨，为何两国边界却一直是未定国界？

霁寒飘雪

2025-11-06 13:40:54

涉案超800万，贵州省住建厅原厅长李光荣受审，退休后7年受贿71万余元

涉案超800万，贵州省住建厅原厅长李光荣受审，退休后7年受贿71万余元

扬子晚报

2025-11-06 14:32:29

周四收盘：今天涨到4008，做好准备了，周五很可能将迎来关键变盘

周四收盘：今天涨到4008，做好准备了，周五很可能将迎来关键变盘

好贤观史记

2025-11-06 15:00:23

“不给50条烟不让走”？知情者称一婚车被拦，新人弃车离开，律师：已达刑事立案标准

“不给50条烟不让走”？知情者称一婚车被拦，新人弃车离开，律师：已达刑事立案标准

封面新闻

2025-11-06 15:37:07

香港冻结太子集团35亿资产！美英新同步出手，国内却静悄悄？

香港冻结太子集团35亿资产！美英新同步出手，国内却静悄悄？

公子麦少

2025-11-05 20:47:52

台当局放话，大陆不答应条件，明年不来参会，外交部只回2句话

台当局放话，大陆不答应条件，明年不来参会，外交部只回2句话

博览历史

2025-11-05 18:25:26

机器学习与Python社区

机器学习算法与Python

3186文章数 11065关注度

往期回顾全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

医院副院长被指出轨眼科主任湖南卫健委：两人被停职

头条要闻

医院副院长被指出轨眼科主任湖南卫健委：两人被停职

体育要闻

送走两位全明星，公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何谁给她的勇气？

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么？怎么大猩猩都来参加新车发布了？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

房产

本地

公开课

军事航空

亲子要闻

amh值低怎么调理好？卵子质量不好如何改善？

房产要闻

中旅·三亚蓝湾，以一座城市会客厅回应世界的滨海想象

本地新闻

这届干饭人，已经把博物馆吃成了食堂

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

美国发射洲际弹道导弹俄方回应

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版