网易首页 > 网易号 > 正文 申请入驻

AI“以小博大”新标杆:三星开源TRM模型,挑战谷歌与OpenAI

0
分享至

IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

该 AI 模型由三星高级 AI 研究院(SAIT)高级 AI 研究员 Alexia Jolicoeur-Martineau 发布,成为 AI 领域“小模型”对抗“大模型”的趋势的重磅新案例。

该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案收敛稳定。


TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

尽管模型极小,TRM 在多个基准测试中展现了“以小博大”的惊人实力:

  • 在 Sudoku-Extreme(极限数独)测试中,其准确率达到 87.4%;
  • 在 Maze-Hard(困难迷宫)中达到 85%;
  • 在衡量抽象推理能力的 ARC-AGI 测试中准确率为 45%;
  • ARC-AGI-2 的准确率为 8%。

尽管 TRM 使用的参数不到 0.01%,但这些结果仍然超过或接近几种高端大型语言模型的性能,包括 DeepSeek R1 、 Gemini 2.5 Pro 和 o3-mini 。



然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林昀儒险胜张本智和后,扎心一幕出现了!男单夺冠后用行动回应一切

林昀儒险胜张本智和后,扎心一幕出现了!男单夺冠后用行动回应一切

好乒乓
2026-01-13 12:14:05
全球第一大女主,让内娱彻底红了眼

全球第一大女主,让内娱彻底红了眼

独立鱼
2026-01-12 22:21:58
邵佳一:14亿人有14亿个教练;苏超、村超球员能在三级联赛站稳再说国足

邵佳一:14亿人有14亿个教练;苏超、村超球员能在三级联赛站稳再说国足

懂球帝
2026-01-12 22:32:13
1955年,一名身体强壮的日本女人赤裸上身背着黑色编织袋站在海边

1955年,一名身体强壮的日本女人赤裸上身背着黑色编织袋站在海边

忠于法纪
2026-01-07 17:46:09
全没了!北京知名老面馆最后一家也关了!

全没了!北京知名老面馆最后一家也关了!

大北京早知道
2026-01-12 16:02:53
国乒全新教练组薪资曝光,马琳总收入突破千万,莎头主管教练推测

国乒全新教练组薪资曝光,马琳总收入突破千万,莎头主管教练推测

体坛白话
2026-01-13 11:09:18
吃他汀猝死的人增多?医生含泪告诫:天冷吃他汀,必须多关注6点

吃他汀猝死的人增多?医生含泪告诫:天冷吃他汀,必须多关注6点

健康之光
2026-01-13 10:51:03
马斯克抛出2026年九大“疯狂”预言:科技狂飙下的未来图景

马斯克抛出2026年九大“疯狂”预言:科技狂飙下的未来图景

娱乐督察中
2026-01-11 13:48:02
2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

2026年新成语:恶意寻子!该警惕了,细节越挖越心寒!

你食不食油饼
2026-01-11 06:41:42
赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

古书记史
2025-12-12 11:21:38
“两艘中国油轮掉头”

“两艘中国油轮掉头”

观察者网
2026-01-13 09:18:09
郑晓宁没想到,闫学晶哭穷风波才半月,萨日娜竟因一句话口碑暴涨

郑晓宁没想到,闫学晶哭穷风波才半月,萨日娜竟因一句话口碑暴涨

泠泠说史
2026-01-12 18:46:57
首例拒签出现!高市早苗怕什么来什么,中方反制直戳痛点,日本赌输了

首例拒签出现!高市早苗怕什么来什么,中方反制直戳痛点,日本赌输了

呼呼历史论
2026-01-13 11:59:43
这一次乌克兰真的是挺不住了,他倒在了第4个冬天。

这一次乌克兰真的是挺不住了,他倒在了第4个冬天。

百态人间
2026-01-12 16:24:00
闫学晶慌了?圈内大佬不再沉默下场表态,冯巩态度属实令人意外

闫学晶慌了?圈内大佬不再沉默下场表态,冯巩态度属实令人意外

削桐作琴
2026-01-09 17:30:49
准备收网?一列火车抵达基辅,英方企图活捉普京,120国收逮捕令

准备收网?一列火车抵达基辅,英方企图活捉普京,120国收逮捕令

策略述
2026-01-13 12:20:53
一位老人感叹:人没必要活得太长寿。60岁走,太年轻;70岁走,有点早;80岁去世,刚好合适。

一位老人感叹:人没必要活得太长寿。60岁走,太年轻;70岁走,有点早;80岁去世,刚好合适。

二胡的岁月如歌
2026-01-12 18:27:06
结束4年蓉城生涯!31岁周定洋宣布离队 下家确定:顶薪转投保级队

结束4年蓉城生涯!31岁周定洋宣布离队 下家确定:顶薪转投保级队

我爱英超
2026-01-12 22:26:52
懒懒硬刚黄一鸣 晒3500万海胆 喊王思聪小猫咪 乘私人飞机和游艇度假

懒懒硬刚黄一鸣 晒3500万海胆 喊王思聪小猫咪 乘私人飞机和游艇度假

老吴教育课堂
2026-01-13 10:09:12
重庆合川小村庄“千人帮杀猪”连吃两天流水席,主厨:杀的几头猪都快吃光了,干16年坝坝宴第一次这么累

重庆合川小村庄“千人帮杀猪”连吃两天流水席,主厨:杀的几头猪都快吃光了,干16年坝坝宴第一次这么累

极目新闻
2026-01-12 22:21:29
2026-01-13 13:16:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
324282文章数 606880关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

印度企业未能获得中国技术 叫停大项目

头条要闻

印度企业未能获得中国技术 叫停大项目

体育要闻

阿隆索得知下课后先是惊讶 然后表示如释重负

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

财经要闻

中国一口气申报20万颗卫星,意味着什么?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

健康
教育
游戏
亲子
军事航空

血常规3项异常,是身体警报!

教育要闻

十二年一体化新型公立学校集团,多岗位招聘!

黑旗&波斯王子RE真要来了?网站疯狂更新!

亲子要闻

2026年“博学杯”全国幼儿阅读大会西南区域赛在弥勒圆满落幕!

军事要闻

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

无障碍浏览 进入关怀版