网易首页 > 网易号 > 正文 申请入驻

AI大模型学会"自己算数":Percepta团队在大模型里造出一台计算机

0
分享至


大语言模型能做奥数题,却算不对两位数乘法,这个尴尬局面一直是AI领域公开的秘密。2026年3月,一家名为Percepta的AI公司发布了一项让业界瞩目的研究,他们直接在Transformer的权重里"建造"了一台计算机,不依赖任何外部工具就能执行任意C语言程序。

这项工作发布后迅速登上Hacker News首页,收获了超过300个赞和130多条评论,连AI领域的标杆人物Karpathy都为其点赞。

这项研究的核心思路其实不复杂。目前业界让大模型做精确计算主要有两条路:一是工具调用,让模型生成代码,再交给外部解释器执行;二是智能体调度,通过外部状态机把任务拆开,循环调用模型处理。
但本质上,这两种方法都相当于给模型装了一个"外挂",计算并不是模型自己完成的。

Percepta团队换了个玩法。他们在Transformer权重中实现了一套RAM计算机和WebAssembly解释器,任何标准程序代码都可以编译成模型能识别的Token指令序列。

比如计算3加5,模型会先把代码写出来,然后切换到快速解码模式,在Transformer内部一步步执行这个程序,把执行过程逐行输出为Token流。


2D注意力头:关键的技术突破

让这件事变得真正可行的,是团队在注意力机制上的创新设计。

在传统的Transformer架构中,每生成一个Token都要对整个历史序列做一次注意力扫描,计算成本随序列长度线性增长。

Percepta设计了一种2D注意力头,把每个历史Token的Key向量设定为二维的,将注意力查询问题转化为计算几何中的凸包极值查询。

借助凸包数据结构,模型在Token生成过程中动态维护历史Key的凸包,每一步注意力查询只需要在凸包上进行,把计算复杂度从O(n)降到了O(log n)。

基于这个原理,团队开发了HullKVCache缓存系统。在普通CPU上就实现了每秒31037个Token的吞吐量,约9000条指令的序列仅需1.3秒即可完成,效率比传统KV缓存提高了近200倍。

更重要的是,这个设计完全基于标准PyTorch Transformer,不需要定制化的内核或稀疏掩码。

实际验证与行业反响

团队选了两个典型的长程精确计算任务来做验证。

第一个是10×10最小费用完美匹配问题,模型在内部执行匈牙利算法,全程以自回归方式生成计算轨迹,CPU上Token生成速度达到每秒33583个。


第二个是世界上最难的数独之一,芬兰数学家Arto Inkala设计的极难数独。模型内部执行一个完整编译后的数独求解器,通过约束传播和回溯搜索,在3分钟内实现了100%准确的求解。
整个计算过程是透明的,每一步的尝试,验证、回溯都以可读日志的形式输出。

这项研究引发了不少讨论和争意。支持者认为,它证明了Transformer不仅仅是统计预测器,还可以成为真正的通用计算基底,未来可以作为推理加速的系统原语。

批评者则指出,博客文章缺少严格的基准测试和训练细节,文本也有过度包装的嫌疑。

不过,抛开争论来看,这项工作确实提供了一个有意思的视角。它表明注意力机制的设计空间远比我们以为的要大,2D注意力头这样看似简单的修改就能带来指数级的效率提升。

领导这项研究的Christos Tzamos是MIT博士,目前担任雅典大学计算机科学副教授和Percepta的创始研究员,Percepta则是General Catalyst旗下的AI转型公司,团队成员来自Meta FAIR,MIT和谷歌等机构。

这项研究虽然还处于早期阶段、距离实际部暑还有距离,但它开辟的方向值得关注:与其给大模型不断加外挂,不如让模型本身就具备精确计算的能力。
这或许是通往更强大AI系统的一条新路径。

阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”


未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别再傻等了!继承父母房产拖着不过户,3年和20年结局天差地别

别再傻等了!继承父母房产拖着不过户,3年和20年结局天差地别

复转这些年
2026-03-22 17:27:58
才4天!疯三就结束了!超3200万人都错了!

才4天!疯三就结束了!超3200万人都错了!

篮球大图
2026-03-23 10:14:17
岛国片中那些被破解的无码作品,女主角人美灯大,姿势硬核

岛国片中那些被破解的无码作品,女主角人美灯大,姿势硬核

全是纪录片
2026-03-22 21:50:35
疯了!曼城双巨星换巴萨神童,哈兰德逼宫引爆重磅交易

疯了!曼城双巨星换巴萨神童,哈兰德逼宫引爆重磅交易

奶盖熊本熊
2026-03-23 06:59:39
地铁出口A、B、C、D藏着方向规律,记住这套方法 全国出行不绕远路

地铁出口A、B、C、D藏着方向规律,记住这套方法 全国出行不绕远路

水泥土的搞笑
2026-03-17 13:38:42
宇树王兴兴年薪曝光!网友破防了!

宇树王兴兴年薪曝光!网友破防了!

广告案例精选
2026-03-23 08:43:11
本田的“万亿跌落”,只用了一个季度

本田的“万亿跌落”,只用了一个季度

观察者网
2026-03-21 08:58:17
伊朗新任最高领袖传出死讯:真没了,还是一场更大的烟雾弹

伊朗新任最高领袖传出死讯:真没了,还是一场更大的烟雾弹

桂系007
2026-03-20 23:50:32
俄罗斯让中国心凉?真正可怕的不是西方围堵,而是我们低估了自己

俄罗斯让中国心凉?真正可怕的不是西方围堵,而是我们低估了自己

爱史纪
2026-03-23 02:56:48
中国驻以色列大使馆:尽快回国

中国驻以色列大使馆:尽快回国

南方都市报
2026-03-23 11:15:22
差一秒就亏大了!锦州加油站挤爆,辽宁车主称有人白排半小时哭晕

差一秒就亏大了!锦州加油站挤爆,辽宁车主称有人白排半小时哭晕

火山詩话
2026-03-23 07:42:25
细节流出!拉里贾尼遇袭事件疑点丛生,恐有诈!

细节流出!拉里贾尼遇袭事件疑点丛生,恐有诈!

刘哥谈体育
2026-03-23 07:21:45
开战以来首次,以色列承认被打痛了,内塔尼亚胡度过最痛苦的一夜

开战以来首次,以色列承认被打痛了,内塔尼亚胡度过最痛苦的一夜

壹只灰鸽子
2026-03-22 11:44:23
至少连续9场40+有多难?NBA仅3人达成,乔丹无缘第一

至少连续9场40+有多难?NBA仅3人达成,乔丹无缘第一

麦子的篮球故事
2026-03-23 12:44:48
废除汉字几十年后,韩语终于被确诊“中国拼音”,韩国人又破防了

废除汉字几十年后,韩语终于被确诊“中国拼音”,韩国人又破防了

棠棣分享
2026-03-23 05:07:26
欧冠转会血泪史:那些让豪门肠子悔青的失败交易

欧冠转会血泪史:那些让豪门肠子悔青的失败交易

茅塞盾开本尊
2026-03-22 13:18:38
油价大变动!3月23日最新加油站95/92号汽油与0号柴油价格正式揭晓

油价大变动!3月23日最新加油站95/92号汽油与0号柴油价格正式揭晓

小怪吃美食
2026-03-23 09:57:40
辽宁多地发布红色预警!能见度小于50米

辽宁多地发布红色预警!能见度小于50米

环球网资讯
2026-03-23 08:50:06
霍尔木兹断航!第一个亚洲国家已断粮倒下,下一个受害者浮出水面

霍尔木兹断航!第一个亚洲国家已断粮倒下,下一个受害者浮出水面

兴史兴谈
2026-03-22 23:50:28
善恶到头终有报,如今73岁的唐国强,已经走上了一条不归路!

善恶到头终有报,如今73岁的唐国强,已经走上了一条不归路!

吴蒂旅行ing
2026-03-20 05:20:46
2026-03-23 13:16:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4600文章数 37437关注度
往期回顾 全部

科技要闻

雷军、蔡崇信最新发声,提到同一件事

头条要闻

紫金矿业将取得赤峰黄金控制权 交易对价合计超182亿

头条要闻

紫金矿业将取得赤峰黄金控制权 交易对价合计超182亿

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

刘烨47岁生日,安娜晒全家福为其庆生

财经要闻

连续暴跌 乱世黄金失灵?

汽车要闻

岚图汽车香江鸣锣 一场关于"国家队"的突围实验

态度原创

家居
游戏
手机
健康
公开课

家居要闻

智慧生活 奢享家居

国外学校现场用PS5玩《刺客信条:枭雄》上历史课

手机要闻

16GB+512GB起!华为Mate 80 Pro Max风驰版今日发布,4月底前完成发货

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版