网易首页 > 网易号 > 正文 申请入驻

Loop-ViT:AI学会「反复思考」,3.8M参数小模型追平人类平均水平

0
分享至



本工作由香港科技大学、中科院自动化所、加州大学圣克鲁斯分校的研究者们共同完成



当我们解一道复杂的数学题或观察一幅抽象图案时,大脑往往需要反复思考、逐步推演。然而,当前主流的深度学习模型却走的是「一次通过」的路线——输入数据,经过固定层数的网络,直接输出答案。

这种前馈式架构在图像分类等感知任务上表现出色,但面对需要多步推理的抽象问题时,却显得力不从心。最典型的例子就是「ARC-AGI 基准测试」——一个被认为是衡量 AI 抽象推理能力的「试金石」。

近日,来自香港科技大学、中科院自动化所、UC Santa Cruz 的研究团队提出了「Loop-ViT」,首次将循环 Transformer 引入视觉推理领域。这个仅有18M 参数的模型,在 ARC-AGI-1 基准上达到了「65.8%」的准确率,超越了参数量高达 73M 的 VARC 集成模型。更令人惊讶的是,其 3.8M 的小型版本也能达到 60.1% 的准确率,几乎追平人类平均水平(60.2%)。



  • 论文标题:LoopViT: Scaling Visual ARC with Looped Transformers
  • 论文链接:https://arxiv.org/abs/2602.02156
  • 代码开源:https://github.com/WenjieShu/LoopViT

什么是 ARC-AGI?

为什么它如此困难?

ARC-AGI(Abstraction and Reasoning Corpus)是由 Keras 之父 François Chollet 提出的抽象推理基准。与 ImageNet 等传统视觉基准不同,ARC 不考察模型识别猫狗、汽车的能力,而是测试其归纳推理能力。

每个 ARC 任务仅提供 2–4 个示例对(输入-输出网格),模型需要从这些示例中归纳出潜在规则,然后将其应用到新的测试输入上。这些规则可能涉及:

  • 对象的平移、旋转、镜像
  • 图案的重复与填充
  • 基于颜色的条件变换
  • 类似「重力」的物理模拟

人类通常能够通过观察示例、提出假设、验证修正的迭代过程来解决这些问题。然而,传统的前馈神经网络却缺乏这种「反复思考」的能力——它们的计算深度被固定绑定在网络层数上。

Loop-ViT 的核心创新



  • 循环架构:解耦计算深度与参数量

传统 Vision Transformer 的计算流程是:输入 → 第 1 层 → 第 2 层 → …… → 第 L 层 → 输出。每增加一层就意味着更多的参数,计算深度与模型容量紧密绑定。

Loop-ViT 的设计理念截然不同:重复执行同一组权重。模型的核心是一个权重共享的 Transformer 块,可以被循环执行 T 次。这意味着:

  • 计算深度可以任意扩展,而不增加参数
  • 模型被迫学习一个通用的「思考步骤」,而非任务特定的启发式规则
  • 类似于人类大脑的工作记忆被反复更新



  • 混合编码块:全局推理 + 局部更新

研究团队观察到,ARC 任务需要两种不同的处理模式:

  • 全局规则归纳:理解整体变换规律(如「所有蓝色变红色」)
  • 局部模式执行:精确的像素级操作(如「填充封闭区域」)

为此,Loop-ViT 设计了Hybrid Block,融合了:

  • 自注意力机制:捕捉全局依赖关系
  • 深度可分离卷积:处理局部空间模式
  • 动态退出:知道何时停止思考

并非所有问题都需要同样长的思考时间。简单的几何变换可能几步就能确定答案,而复杂的算法推理则需要更多迭代。

Loop-ViT 引入了基于熵的动态退出机制

  • 每次迭代后,计算预测分布的 Shannon 熵
  • 当熵值低于阈值(模型「确信」了答案),立即停止
  • 无需任何额外参数,完全基于模型的内在不确定性

实验表明,能够「早退」的样本准确率高达 83.33%,而需要完整迭代的困难样本准确率为 45.80%。这与人类的认知资源分配策略惊人地一致——简单问题快速解决,复杂问题投入更多时间。

实验结果:

小参数,大性能

在 ARC-AGI-1 基准上,Loop-ViT 的表现令人印象深刻。几个关键观察如下:



参数效率惊人:3.8M 的 Loop-ViT-Small 超越 18M 的 VARC,仅用 1/5 参数。

超越模型集成:18M 的 Loop-ViT 超越 73M 的 VARC 四模型集成。

深入理解:

模型在「思考」什么?

研究团队对 Loop-ViT 的内部机制进行了可视化分析,揭示了有趣的「涌现」行为:

预测结晶现象:随着迭代进行,模型的预测从模糊逐渐变得清晰确定。早期迭代的预测波动较大,后期则趋于稳定——就像溶液中的晶体逐渐析出。

注意力模式演化

  • 早期迭代:注意力分布广泛,模型在「扫描」整个输入,收集信息。
  • 后期迭代:注意力变得稀疏聚焦,精确对准需要操作的区域。

这种从「全局探索」到「局部执行」的转变,与人类解决视觉推理问题的策略高度相似。

结语

Loop-ViT 的成功揭示了一个重要洞见:在视觉领域,对于需要推理的任务,「思考时间」比「模型大小」更重要。

这与当前大模型领域一味追求参数规模的趋势形成鲜明对比。也许,实现真正的人工智能不仅需要更大的网络,更需要让模型学会像人一样「反复思考」。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
继无法招生后,福耀科技大学又摊上事了,入职博士生曝光毁约内幕

继无法招生后,福耀科技大学又摊上事了,入职博士生曝光毁约内幕

爱下厨的阿椅
2026-05-06 09:59:43
原来富人家插座也是歪的!陆家嘴女孩晒才艺,窗外风景成最大亮点

原来富人家插座也是歪的!陆家嘴女孩晒才艺,窗外风景成最大亮点

知晓科普
2026-05-04 06:30:10
王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

洪观新闻
2026-05-06 12:06:56
上海嘉定最新公告:区部分街镇行政区划变更

上海嘉定最新公告:区部分街镇行政区划变更

上观新闻
2026-05-06 10:34:05
伟伟道来 | 伊朗的反应为何如此激烈

伟伟道来 | 伊朗的反应为何如此激烈

经济观察报
2026-05-06 11:40:46
浏阳爆炸烟花厂附近居民:多名中老年妇女在厂内工作,一女性从围墙洞口逃生

浏阳爆炸烟花厂附近居民:多名中老年妇女在厂内工作,一女性从围墙洞口逃生

鸡蛋bot
2026-05-05 15:44:51
伊朗外长阿拉格齐身穿休闲装抵达北京,开启访问行程

伊朗外长阿拉格齐身穿休闲装抵达北京,开启访问行程

鲁中晨报
2026-05-06 10:10:13
阿姨的气质让小哥挡不住

阿姨的气质让小哥挡不住

贵圈真乱
2026-05-06 10:13:32
绥化两名十一二岁女孩失联多日遭遇不测,警方:正全力办案

绥化两名十一二岁女孩失联多日遭遇不测,警方:正全力办案

极目新闻
2026-05-06 11:44:25
太豪了!诺兰的史诗级巨制,终于来了

太豪了!诺兰的史诗级巨制,终于来了

来看美剧
2026-05-05 21:47:15
吴宜泽斯诺克世锦赛夺冠后首次发文:我会永远真诚的真正的完全的爱着你

吴宜泽斯诺克世锦赛夺冠后首次发文:我会永远真诚的真正的完全的爱着你

扬子晚报
2026-05-05 14:00:06
活塞6人上双1-0骑士:哈登22+8+7双里程碑 米切尔23分坎宁安23+7

活塞6人上双1-0骑士:哈登22+8+7双里程碑 米切尔23分坎宁安23+7

醉卧浮生
2026-05-06 09:37:27
连线四川华蓥女游客玩秋千身亡目击者:其撞到瀑布凸出处大石

连线四川华蓥女游客玩秋千身亡目击者:其撞到瀑布凸出处大石

南方都市报
2026-05-06 12:38:05
26死!一员工因亲属在浏阳花炮事故中离世请假,获领导暖心批复

26死!一员工因亲属在浏阳花炮事故中离世请假,获领导暖心批复

火山詩话
2026-05-06 10:04:31
夺冠不到24小时!英球迷质疑艾伦关键球,要求严查 还回冠军

夺冠不到24小时!英球迷质疑艾伦关键球,要求严查 还回冠军

林子说事
2026-05-06 09:42:04
在中国人民公安大学,穿了四年警服,毕业五年后,我们宿舍四个人,没一个在出现场

在中国人民公安大学,穿了四年警服,毕业五年后,我们宿舍四个人,没一个在出现场

侃故事的阿庆
2026-05-06 09:21:32
26死!浏阳花炮按下暂停键,国内超7成的烟花出口份额,或受重创

26死!浏阳花炮按下暂停键,国内超7成的烟花出口份额,或受重创

火山詩话
2026-05-05 16:22:11
金建希案法官死亡细节披露!疑似坠亡,贴身衣物里有遗书:对不起,我先离开了

金建希案法官死亡细节披露!疑似坠亡,贴身衣物里有遗书:对不起,我先离开了

红星新闻
2026-05-06 09:14:45
“排队3小时,打卡1分钟”,多景区迎“泼天流量”

“排队3小时,打卡1分钟”,多景区迎“泼天流量”

澎湃新闻
2026-05-06 00:04:10
中美同时向全球下达禁令,各国都傻眼了!美媒:中国此举史无前例

中美同时向全球下达禁令,各国都傻眼了!美媒:中国此举史无前例

桑启红原
2026-05-06 05:00:41
2026-05-06 13:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12922文章数 142643关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

吴宜泽称欲拿奖金在英买房 50万英镑奖金需交税超23万

头条要闻

吴宜泽称欲拿奖金在英买房 50万英镑奖金需交税超23万

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

人形机器人七小龙:谁真能卖 谁在讲故事?

汽车要闻

吉利原生新能源越野架构亮相 AI如何带来极致越野

态度原创

教育
健康
亲子
数码
房产

教育要闻

中高考专题讲座(2) 谨防“放羊”状态

干细胞治烧烫伤面临这些“瓶颈”

亲子要闻

暑假快到了,游泳学起来吧!为了安全和玩水!

数码要闻

be quiet!风冷DARK ROCK 6 / Pro 6发布,至高300W解热能力

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

无障碍浏览 进入关怀版