![]()
大语言模型能做奥数题,却算不对两位数乘法,这个尴尬局面一直是AI领域公开的秘密。2026年3月,一家名为Percepta的AI公司发布了一项让业界瞩目的研究,他们直接在Transformer的权重里"建造"了一台计算机,不依赖任何外部工具就能执行任意C语言程序。
这项工作发布后迅速登上Hacker News首页,收获了超过300个赞和130多条评论,连AI领域的标杆人物Karpathy都为其点赞。
这项研究的核心思路其实不复杂。目前业界让大模型做精确计算主要有两条路:一是工具调用,让模型生成代码,再交给外部解释器执行;二是智能体调度,通过外部状态机把任务拆开,循环调用模型处理。
但本质上,这两种方法都相当于给模型装了一个"外挂",计算并不是模型自己完成的。
Percepta团队换了个玩法。他们在Transformer权重中实现了一套RAM计算机和WebAssembly解释器,任何标准程序代码都可以编译成模型能识别的Token指令序列。
比如计算3加5,模型会先把代码写出来,然后切换到快速解码模式,在Transformer内部一步步执行这个程序,把执行过程逐行输出为Token流。
![]()
2D注意力头:关键的技术突破
让这件事变得真正可行的,是团队在注意力机制上的创新设计。
在传统的Transformer架构中,每生成一个Token都要对整个历史序列做一次注意力扫描,计算成本随序列长度线性增长。
Percepta设计了一种2D注意力头,把每个历史Token的Key向量设定为二维的,将注意力查询问题转化为计算几何中的凸包极值查询。
借助凸包数据结构,模型在Token生成过程中动态维护历史Key的凸包,每一步注意力查询只需要在凸包上进行,把计算复杂度从O(n)降到了O(log n)。
基于这个原理,团队开发了HullKVCache缓存系统。在普通CPU上就实现了每秒31037个Token的吞吐量,约9000条指令的序列仅需1.3秒即可完成,效率比传统KV缓存提高了近200倍。
更重要的是,这个设计完全基于标准PyTorch Transformer,不需要定制化的内核或稀疏掩码。
实际验证与行业反响
团队选了两个典型的长程精确计算任务来做验证。
第一个是10×10最小费用完美匹配问题,模型在内部执行匈牙利算法,全程以自回归方式生成计算轨迹,CPU上Token生成速度达到每秒33583个。
![]()
第二个是世界上最难的数独之一,芬兰数学家Arto Inkala设计的极难数独。模型内部执行一个完整编译后的数独求解器,通过约束传播和回溯搜索,在3分钟内实现了100%准确的求解。
整个计算过程是透明的,每一步的尝试,验证、回溯都以可读日志的形式输出。
这项研究引发了不少讨论和争意。支持者认为,它证明了Transformer不仅仅是统计预测器,还可以成为真正的通用计算基底,未来可以作为推理加速的系统原语。
批评者则指出,博客文章缺少严格的基准测试和训练细节,文本也有过度包装的嫌疑。
不过,抛开争论来看,这项工作确实提供了一个有意思的视角。它表明注意力机制的设计空间远比我们以为的要大,2D注意力头这样看似简单的修改就能带来指数级的效率提升。
领导这项研究的Christos Tzamos是MIT博士,目前担任雅典大学计算机科学副教授和Percepta的创始研究员,Percepta则是General Catalyst旗下的AI转型公司,团队成员来自Meta FAIR,MIT和谷歌等机构。
这项研究虽然还处于早期阶段、距离实际部暑还有距离,但它开辟的方向值得关注:与其给大模型不断加外挂,不如让模型本身就具备精确计算的能力。
这或许是通往更强大AI系统的一条新路径。
阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”
![]()
未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。
截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.