网易首页 > 网易号 > 正文 申请入驻

AI“以小博大”新标杆:三星开源TRM模型,挑战谷歌与OpenAI

0
分享至

IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

该 AI 模型由三星高级 AI 研究院(SAIT)高级 AI 研究员 Alexia Jolicoeur-Martineau 发布,成为 AI 领域“小模型”对抗“大模型”的趋势的重磅新案例。

该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案收敛稳定。


TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

尽管模型极小,TRM 在多个基准测试中展现了“以小博大”的惊人实力:

  • 在 Sudoku-Extreme(极限数独)测试中,其准确率达到 87.4%;
  • 在 Maze-Hard(困难迷宫)中达到 85%;
  • 在衡量抽象推理能力的 ARC-AGI 测试中准确率为 45%;
  • ARC-AGI-2 的准确率为 8%。

尽管 TRM 使用的参数不到 0.01%,但这些结果仍然超过或接近几种高端大型语言模型的性能,包括 DeepSeek R1 、 Gemini 2.5 Pro 和 o3-mini 。



然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
下周,A股这些板块更有望上涨

下周,A股这些板块更有望上涨

每经牛眼
2025-11-02 11:35:20
东契奇成为历史上首位赛季前3场拿125分+20助攻的球员

东契奇成为历史上首位赛季前3场拿125分+20助攻的球员

雷速体育
2025-11-01 18:32:28
从12月1日起,中国对荷兰稀土出口实施新管控,含量超0.1%须申请许可

从12月1日起,中国对荷兰稀土出口实施新管控,含量超0.1%须申请许可

蓝色海边
2025-11-02 12:28:22
正式签约,张本美和重返中国,上任新岗位,薪酬曝光,爸爸也加盟

正式签约,张本美和重返中国,上任新岗位,薪酬曝光,爸爸也加盟

乐聊球
2025-11-01 11:22:15
两蒋灵柩现状:台湾不想要,亲人懒得管,“台独”分子泼油漆泄愤

两蒋灵柩现状:台湾不想要,亲人懒得管,“台独”分子泼油漆泄愤

老闫侃史
2025-11-01 12:30:03
被求援?俄罗斯回应了

被求援?俄罗斯回应了

环球时报国际
2025-11-02 12:53:08
德外长再改口,希望中方既往不咎,中方没拒绝,但提出一个条件

德外长再改口,希望中方既往不咎,中方没拒绝,但提出一个条件

田园小归
2025-11-02 09:36:59
0-5到3-5!名将连救3赛点,周跃龙4-2逆转,白雨露德比战2-3落后

0-5到3-5!名将连救3赛点,周跃龙4-2逆转,白雨露德比战2-3落后

刘姚尧的文字城堡
2025-11-02 12:26:08
刚刚公布的 iPhone Air 销量,给我看傻了

刚刚公布的 iPhone Air 销量,给我看傻了

刘奔跑
2025-11-01 23:42:50
细思极恐!澳洲杨兰兰撞残人后,消失得无影无踪,她到底去了哪里

细思极恐!澳洲杨兰兰撞残人后,消失得无影无踪,她到底去了哪里

一盅情怀
2025-10-27 17:26:27
刘伯温最经典的七句话,背下来,让你内心强大到无敌

刘伯温最经典的七句话,背下来,让你内心强大到无敌

诗词中国
2025-10-10 18:44:44
6万球迷见证!苏超联赛冠军诞生:泰州点球4-3击败南通,一黑到底

6万球迷见证!苏超联赛冠军诞生:泰州点球4-3击败南通,一黑到底

侃球熊弟
2025-11-01 20:26:47
中国正在上演的诡异经济

中国正在上演的诡异经济

难得君
2025-10-29 19:26:55
不是胰脏癌!坣娜真正死因曝光..老公心碎发声:在床边抱着她离世

不是胰脏癌!坣娜真正死因曝光..老公心碎发声:在床边抱着她离世

ETtoday星光云
2025-10-31 11:22:10
谈到两岸统一,洪秀柱提醒郑丽文“没什么好怕”,郑根本不敢回她

谈到两岸统一,洪秀柱提醒郑丽文“没什么好怕”,郑根本不敢回她

头条爆料007
2025-11-02 11:52:44
泰国最窄处仅11公里,为什么在历史上没有被缅甸截断过?原因简单

泰国最窄处仅11公里,为什么在历史上没有被缅甸截断过?原因简单

凡人侃史
2025-10-31 11:27:27
我国哪里苹果最好吃?经过评选,这5种苹果上榜了, 你尝过几种?

我国哪里苹果最好吃?经过评选,这5种苹果上榜了, 你尝过几种?

思思夜话
2025-10-31 17:36:34
突发!香港著名天后紧急入院,腰部两处撕裂,需拄拐杖坐轮椅外出

突发!香港著名天后紧急入院,腰部两处撕裂,需拄拐杖坐轮椅外出

阿废冷眼观察所
2025-11-02 10:20:32
老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老嘪科普
2025-10-23 19:21:38
董宇辉成大款,顿顿当老板,留下的YOYO却熬成“废子”令人唏嘘

董宇辉成大款,顿顿当老板,留下的YOYO却熬成“废子”令人唏嘘

娱小北
2025-11-01 19:36:27
2025-11-02 14:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
313066文章数 606699关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

牛弹琴:高市早苗上台后 中国作出第一次强烈抗议

头条要闻

牛弹琴:高市早苗上台后 中国作出第一次强烈抗议

体育要闻

李大林获2025北马国内男子组冠军

娱乐要闻

离世的他曾是刘德华张学友御用班底

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

亲子
本地
时尚
健康
军事航空

亲子要闻

孕期低糖控糖指南:科学饮食守护母婴健康的甜蜜平衡

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

推广|| 每天都在穿!这件外套,轻松搞定秋冬所有搭配

核磁VS肌骨超声,谁更胜一筹?

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版