网易首页 > 网易号 > 正文 申请入驻

DeepSeek之后,清华和智谱AI提出“视觉压缩”新范式

0
分享至


大型语言模型(LLM)在处理超长上下文时面临着巨大的计算和内存成本挑战,这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案,如扩展位置编码或优化注意力机制,往往无法从根本上解决 token 序列长度带来的开销,而检索增强(RAG)方法又可能引入信息丢失和额外延迟。

核心创新:视觉-文本压缩

https://arxiv.org/abs/2510.17800

清华大学和智谱AI等机构提出的 Glyph 框架,为这一难题提供了一个极具创新性的"非对称"解决方案:

  1. 信息密度革命 :将冗长的文本内容渲染成紧凑的图像

  2. 跨模态处理 :利用视觉-语言模型(VLM)处理视觉化文本

  3. 效率突破 :单个视觉token可承载3-4倍文本信息量

技术实现三阶段 1. 持续预训练
  • 训练数据:多样化渲染文本数据集

  • 核心目标:建立视觉符号与语义的映射关系

2. LLM驱动的渲染搜索
  • 采用遗传算法优化参数:

    • 字体样式

    • 版面布局

    • DPI分辨率

  • 平衡点:压缩率 vs 模型性能

3. 后训练优化
  • 监督微调(SFT)

  • 强化学习(RL)

  • OCR辅助任务(提升文本识别精度)

实验成果

指标

提升幅度

对比基线

Token压缩率

3-4倍

传统文本token

推理速度

最高4倍

Qwen3-8B

训练效率

约2倍

常规SFT

LongBench得分

相当/超越

同级LLM


战略意义

  1. 新范式互补 :与注意力机制优化形成技术矩阵

  2. 扩展性突破 :为百万级token处理铺平道路

  3. 跨模态增益 :同步提升真实场景文档理解能力

该研究预示AI系统处理超长上下文的能力即将进入新纪元,相关代码已开源。














特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
电商纳税新规来了,销售超10万必须升级个体或公司,有人直接关门

电商纳税新规来了,销售超10万必须升级个体或公司,有人直接关门

眼光很亮
2025-11-06 10:26:13
台湾用上高德地图了,它是怎么做到的?背后隐藏了哪些关键技术

台湾用上高德地图了,它是怎么做到的?背后隐藏了哪些关键技术

历史有些冷
2025-11-05 19:35:03
官宣,王曼昱或被处罚,国际乒联开罚单原因曝光,王励勤不该犯错

官宣,王曼昱或被处罚,国际乒联开罚单原因曝光,王励勤不该犯错

乐聊球
2025-11-05 14:41:44
处决吴石当天,陈诚叫停了台湾所有的死刑,究竟是​怜悯还是算计

处决吴石当天,陈诚叫停了台湾所有的死刑,究竟是​怜悯还是算计

小涛叨叨
2025-11-06 11:26:17
特朗普学拜登,也在裤腿里绑了尿袋,半身不遂的年纪,真是可怜

特朗普学拜登,也在裤腿里绑了尿袋,半身不遂的年纪,真是可怜

我心纵横天地间
2025-11-05 19:25:51
进了就是好球!布朗尼罚球线迎着防守 中投打板命中

进了就是好球!布朗尼罚球线迎着防守 中投打板命中

林子说事
2025-11-06 13:46:15
桃色大瓜!湖南省人民医院副院长与美女眼科主任的瓜

桃色大瓜!湖南省人民医院副院长与美女眼科主任的瓜

金陵隐士
2025-11-06 09:34:50
王爱和,被查

王爱和,被查

新京报政事儿
2025-11-06 12:52:41
鹿哈官宣领证不到24小时,令人担心的事接连发生,岳云鹏没说错

鹿哈官宣领证不到24小时,令人担心的事接连发生,岳云鹏没说错

白面书誏
2025-11-06 13:38:55
斯诺克最新战报!吴宜泽连战连捷,第2局零封TOP16,赵心童暂落后

斯诺克最新战报!吴宜泽连战连捷,第2局零封TOP16,赵心童暂落后

刘姚尧的文字城堡
2025-11-06 15:21:53
荷兰政府花200亿挽留无效,光刻机巨头ASML为何执意从老家搬走?

荷兰政府花200亿挽留无效,光刻机巨头ASML为何执意从老家搬走?

凡知
2025-11-06 11:38:13
国运来了挡不住!30亿吨铁矿重见天日,美媒:中国将改写全球格局

国运来了挡不住!30亿吨铁矿重见天日,美媒:中国将改写全球格局

墨兰史书
2025-11-06 07:40:03
中方重拳击阿萨德,俄美英法难以应对,朱拉尼逆流而上?

中方重拳击阿萨德,俄美英法难以应对,朱拉尼逆流而上?

林子说事
2025-11-06 06:24:48
突发!辉瑞、默沙东22款进口药退场,真相和你用药息息相关

突发!辉瑞、默沙东22款进口药退场,真相和你用药息息相关

刘哥谈体育
2025-11-06 10:39:01
中国和塔吉克斯坦没有深仇大恨,为何两国边界却一直是未定国界?

中国和塔吉克斯坦没有深仇大恨,为何两国边界却一直是未定国界?

霁寒飘雪
2025-11-06 13:40:54
涉案超800万,贵州省住建厅原厅长李光荣受审,退休后7年受贿71万余元

涉案超800万,贵州省住建厅原厅长李光荣受审,退休后7年受贿71万余元

扬子晚报
2025-11-06 14:32:29
周四收盘:今天涨到4008,做好准备了,周五很可能将迎来关键变盘

周四收盘:今天涨到4008,做好准备了,周五很可能将迎来关键变盘

好贤观史记
2025-11-06 15:00:23
“不给50条烟不让走”?知情者称一婚车被拦,新人弃车离开,律师:已达刑事立案标准

“不给50条烟不让走”?知情者称一婚车被拦,新人弃车离开,律师:已达刑事立案标准

封面新闻
2025-11-06 15:37:07
香港冻结太子集团35亿资产!美英新同步出手,国内却静悄悄?

香港冻结太子集团35亿资产!美英新同步出手,国内却静悄悄?

公子麦少
2025-11-05 20:47:52
台当局放话,大陆不答应条件,明年不来参会,外交部只回2句话

台当局放话,大陆不答应条件,明年不来参会,外交部只回2句话

博览历史
2025-11-05 18:25:26
2025-11-06 16:48:49
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3186文章数 11065关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

头条要闻

医院副院长被指出轨眼科主任 湖南卫健委:两人被停职

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

亲子
房产
本地
公开课
军事航空

亲子要闻

amh值低怎么调理好?卵子质量不好如何改善?

房产要闻

中旅·三亚蓝湾,以一座城市会客厅回应世界的滨海想象

本地新闻

这届干饭人,已经把博物馆吃成了食堂

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版