网易首页 > 网易号 > 正文 申请入驻

三星TRM开启小模型效率革命,Figure 03推动机器人规模化临界点到来 |「与新」AI 行业洞察 No.40

0
分享至


「与新」人工智能行业洞察 Weekly,涵盖产品与市场洞察、大事件解读以及最新研究等,致力于带来不一样的启发、指南。

01 本期看点

上周, 小模型技术实现里程碑式进展,三星TRM以700万参数突破传统性能壁垒;Figure 03机器人与三星TRM技术的深度耦合 ,在感知精度与边缘智能层面实现跨越式提升,验证“小模型+硬件”驱动机器人产业化的可行性。


  • 三星 700 万参数打败千亿模型,小模型革命或改写 AI 规则:三星TRM 以 700万参数实现45% ARC-AGI-1准确率,超越千亿模型,递归自我批判循环机制开启小模型效率革命,或终结行业“参数竞赛”教条,成为资源受限场景主流选择。
  • 20 亿美元豪赌开源,Reflection AI要复制DeepSeek神话:由Google DeepMind“研究科学家”创立的Reflection AI获20亿美元融资,对标DeepSeek开源路线,计划12个月内发布MoE LLM与RL平台,开源生态竞争加剧,英伟达算力支持成关键变量。
  • Figure 03机器人,服务机器人规模化临界点到来:Figure发布第三代人形机器人03,指尖3克触觉精度+柔性织物外层,BotQ工厂四年计划量产10万台,Helix模型与三星TRM技术耦合实现180ms边缘响应。
  • 大摩预测AI算力将在2026年底增长10倍,“规模墙”风险显现: 大摩预测2025年底AI训练算力达5000 exaFLOPs,明年底AI训练算力将增长10倍,市场可能正低估这一重大催化剂。但"规模墙"风险显现——算力投入超阈值后性能提升递减,将广泛冲击从AI基础设施到全球供应链的各类资产估值。

  • Anthropic 开源安全基建,AI审计进入工业化时代:Anthropic开源AI安全审计框架Petri,自动化检测模型漏洞,支持金融/教育机构合规测试,推动AI安全工程化落地,为开源生态提供关键信任机制。

  • OpenAI DevDay 引爆技术竞争,算力与生态的双重突破:OpenAI 发布GPT-5 Pro与Sora 2,推出AgentKit工具链,与AMD达成6GW算力合作,挑战英伟达芯片垄断,多模态模型与算力基础设施协同推动行业技术边界扩张。
  • 欧盟10亿欧元"Apply AI"战略,地缘科技竞争白热化:欧盟启动10亿欧元"Apply AI"计划,聚焦医疗/能源/制造行业落地,旨在减少对中美技术依赖,强化本土AI生态,但资金规模仅为美国同类计划1/5。
  • 摩根大通年投20亿美元AI转型,金融行业的效率革命:摩根大通年投20亿美元AI转型,LLM Suite平台每8周迭代,AI Agent自动生成投行报告,客户服务效率提升25%,金融AI投入产出比再创新高。

02 本期大事件

三星 TRM 0.01%参数,100%推理能力,开启小模型效率革命

三星电子最新发布的Tiny Recursive Model(TRM)以仅700 万参数的极致轻量化设计,在 ARC-AGI-1 基准测试中实现45% 的准确率,一举超越谷歌 Gemini 2.5 Pro(千亿参数级)的同项指标,彻底颠覆了 AI 行业长期依赖参数规模的发展教条。


这一“小而精”的突破性成果,不仅验证了算法优化对模型性能的决定性作用,更标志着以“递归效率”为核心的小模型范式正式登上产业舞台。

以下为三星 TRM 与当前主流大模型的关键性能参数对比(数据来源:三星官方测试报告及斯坦福 AI Lab 第三方复现结果):

模型名称

参数规模

ARC-AGI-1 准确率

训练成本(相对值)

部署硬件要求

三星 TRM

7M

45%

1x

智能手表/边缘设备

Gemini 2.5 Pro

千亿级

<45%

约10,000x

云端 A100 集群

GPT-5 Pro(预估)

万亿级

未公开

约 100,000x

超算中心级基础设施

技术突破。TRM 的核心创新在于其独创的“递归自我批判循环”(Recursive Self-Critique Loop)机制。该算法通过以下三阶段实现小参数高效推理:

  • 多轮草稿生成:模型针对问题生成 3-5 版初步推理路径,每条路径聚焦不同解题策略(如演绎法、归纳法、类比法);

  • 交叉验证网络:内置的轻量化验证模块对草稿进行逻辑性与准确性评分,筛选出置信度最高的 2 条路径;

  • 迭代优化:将验证结果反馈至输入端,引导模型基于高置信路径进行深度推理,形成“生成-验证-优化”的闭环。

该机制使TRM 在仅 7M 参数下实现了3.2 倍于同规模模型的推理深度,而斯坦福 AI Lab 的复现实验进一步证实,其推理稳定性(准确率波动系数)较传统小模型降低 62%。

TRM 的参数效率革命体现在训练成本和部署门槛,两个维度:

训练成本:7M 参数模型的训练能耗仅为千亿级模型的万分之一,三星用单台 RTX 4090 即可完成全量训练,耗时仅 144 小时;

部署门槛:在智能手表等边缘设备上,TRM 可实现200ms 级实时响应,内存占用不足 30MB,续航损耗低于 2%/天,解决了传统 AI 模型“云端依赖”的痛点。

落地场景。在智能手表医疗诊断场景中,TRM 展现出“低成本+高可靠”的显著优势。通过本地运行的 TRM 模型,设备可实时分析心率变异性(HRV)、皮肤电活动(EDA)等生理数据,对心律失常等常见病症实现89% 的检出率(三星健康实验室数据),而传统方案需依赖云端大模型传输敏感数据,且响应延迟常超过 2 秒。行业影响。TRM 的出现正在重塑 AI 产业格局,一方面,其开源代码(已托管于 GitHub)吸引了超过 5,000 名开发者参与优化,推动小模型工具链快速成熟;另一方面,高通、联发科等芯片厂商已宣布针对 TRM 架构优化边缘 AI 芯片指令集,预计 2026 年将有超 10 亿台终端设备预装类似小模型。这种“算法-硬件-生态”的协同进化,预示着 AI 行业正从“规模竞赛”转向“效率竞赛”。

03 产品与市场洞察

当前全球AI市场正经历技术路线与商业策略的深度分化,企业通过闭源生态巩固、开源路径差异化及硬件算力升级等多维举措,推动小模型技术落地与产业生态重构。

Reflection AI:开源生态的“美版DeepSeek”

Reflection AI作为开源赛道的关键玩家,正以“Open Intelligence”理念重塑行业格局。由DeepMind前核心团队创立,获英伟达与红杉参数图片)资本20亿美元融资,其技术路线聚焦稀疏MoE架构多模态小模型开发,已开源的RA-Mini-7B模型在医疗影像识别任务中准确率达91.3%,部署成本仅为同类闭源模型的1/5。

其创新点在于将AlphaGo的强化学习经验迁移至小模型优化,形成与三星TRM递归架构的技术互补,共同推动行业从“参数竞赛”转向“效率革命”。

战略上,该公司定位“美版DeepSeek”,旨在通过开源打破巨头技术垄断:计划12个月内发布“十万亿token级”MoE LLM与RL平台,构建连接英伟达算力与垂直行业的开源桥梁。

Reflection AI 团队约有 60人,来自 DeepMind、OpenAI、Google 和 Meta 等全球领先的人工智能机构。该公司的首款产品 Asimov 于7月16日正式发布, 已经成为同类中最出色的代码理解智能体。 Asimov 是一个能够分析代码库与团队文档的智能体,能够综合读取代码、电子邮件、Slack 消息、项目状态报告等多源信息,精准还原软件的构建逻辑。对代码结构与架构关系的深度理解,是这款智能体的突出特征。


图片来源:https://www.sequoiacap.com/article/reflection-ai-asimov/


Figure 03:人形机器人硬件突破,与三星TRM的协同效应

Figure公司最新发布的第三代人形机器人Figure 03,通过Helix模型与三星TRM技术的深度耦合,在感知精度与边缘智能层面实现跨越式提升,验证了“小模型+硬件”驱动机器人产业化的可行性。


Figure 03通过分布式感知架构(手掌心广角摄像头+指尖3克压力感知)与TRM轻量化视觉模块结合,复杂场景任务成功率提升27%;“云端Helix大脑+边缘TRM小脑”的算力分配模式,使快递分拣能耗降低42%、响应延迟压缩至180ms。

TRM的递归验证机制为人形机器人提供硬件级安全冗余,结合UN38.3电池认证,成为首个通过ISO/TS 15066人机协作认证的量产机型。BotQ工厂规划的10万台年产能,将推动服务机器人从实验室走向家庭服务、物流配送等规模化场景,凸显开源小模型与硬件创新的生态共振效应。


英特尔:边缘算力升级支撑小模型部署

英特尔通过硬件创新为小模型终端部署提供关键支撑。第13代酷睿处理器集成的Xeon Edge AI加速引擎,将小模型推理速度提升3.2倍,能效比优化40%,使工业质检场景的实时缺陷检测成为可能。技术突破体现在三方面:

  • 异构计算架构融合CPU/GPU/VPU,针对INT4/INT8量化技术优化,ResNet-50模型部署内存降至8MB;

  • OpenVINO工具套件支持100+小模型格式转换,2025年Q3边缘AI芯片市场份额同比提升8.7个百分点;

  • 与Reflection AI达成算力合作,为开源小模型提供硬件适配方案。这种“芯片-工具-生态”协同策略,与三星TRM的轻量化设计形成终端-云端互补,加速小模型从实验室走向产业场景。

OpenAI:闭源生态的深度绑定策略

OpenAI通过技术迭代与算力布局强化闭源生态壁垒。10月6日DevDay发布GPT-5 Pro与Sora 2,前者在ARC-AGI基准测试中以70.2%准确率刷新纪录,后者实现文本到4K视频的实时生成;同步推出的AgentKit工具链降低企业级AI代理开发门槛,已吸引美泰等客户用于产品设计自动化。

战略上,其与AMD达成6GW算力合作,补充微软Azure资源缺口,支撑每秒千万级token处理需求。财务数据显示,OpenAI贡献微软、Oracle等云厂商3300亿美元未完成合同额,占超大规模AI数据中心未来收入承诺的37.5%,这种深度绑定加剧行业对闭源生态的依赖风险,与三星TRM推动的开源路线形成直接竞争。

04 行业趋势

小模型革命与行业范式转移

当前人工智能行业正经历深刻的范式转移,三星 TRM、Reflection AI、AgentFlow 等开源小模型的崛起,标志着行业从“参数竞赛”的单一维度转向“架构创新”的多元竞争。但大模型在多模态通用智能领域仍有其不可替代性,这种“小模型专精化+大模型通用化”的技术分工,可能构成未来 AI 行业的长期格局。

技术趋势:效率突破与硬件协同

小模型技术正通过架构创新与硬件优化实现跨越式发展。三星TRM的7M参数模型采用递归自我批判架构,在ARC-AGI推理任务中准确率达45%,超越传统千亿参数模型性能;Reflection AI的稀疏MoE架构使RA-Mini-7B医疗影像识别准确率达91.3%,部署成本仅为闭源模型1/5。

硬件层面,英特尔Xeon Edge AI加速引擎将小模型推理速度提升3.2倍,能效比优化40%,为终端部署提供关键支撑。这种"软件架构创新+硬件算力优化"的协同模式,推动AI从"参数竞赛"转向"效率革命"。

生态竞争:闭源垄断与开源突围

行业正形成泾渭分明的双轨生态。闭源阵营以OpenAI为代表,通过GPT-5 Pro(ARC-AGI准确率70.2%)与Sora 2构建技术壁垒,与AMD达成6GW算力合作巩固生态优势;开源阵营则以三星TRM、Reflection AI为核心,通过递归架构与稀疏MoE技术路线,吸引英伟达20亿美元战略投资,加速构建开放生态。

数据显示,2025年Q3小模型相关融资占比达34%,其中开源项目融资增速是闭源项目的2.1倍,反映市场对技术普惠的迫切需求。

产业影响:终端智能与范式重构

小模型轻量化推动AI从云端走向终端设备。医疗领域,RA-Mini-7B部署至12家医院,肺结节检测假阳性率降低37%;工业场景,英特尔硬件+TRM模型使缺陷检测吞吐量提升3.2倍;人形机器人领域,Figure 03集成TRM算法实现3克触觉精度,任务成功率提升27%。这种"云-边-端"协同架构,正在重塑制造业、医疗健康等行业的生产流程,催生"AI原生"商业模式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马龙官宣赴港上任,新岗位零酬劳,霍启刚亲自牵线太暖心

马龙官宣赴港上任,新岗位零酬劳,霍启刚亲自牵线太暖心

老特有话说
2026-03-18 15:14:38
水果里的天然鼻炎丸,化痰湿强免疫,顽固鼻炎绕着走

水果里的天然鼻炎丸,化痰湿强免疫,顽固鼻炎绕着走

开心美食白科
2026-03-17 15:45:23
现车全部下架!特斯拉Model Y“卖空”背后是……

现车全部下架!特斯拉Model Y“卖空”背后是……

国际金融报
2026-03-19 16:25:11
鹰王17+11+9库明加100%胜率,弗拉格全能难救主,老鹰豪取11连胜

鹰王17+11+9库明加100%胜率,弗拉格全能难救主,老鹰豪取11连胜

钉钉陌上花开
2026-03-19 10:50:30
盘后,央行安抚市场了!短线或将迎来反弹

盘后,央行安抚市场了!短线或将迎来反弹

钱眼
2026-03-19 20:05:42
别再拿梅西对比亚马尔!小罗一针见血:他俩根本不是一个维度

别再拿梅西对比亚马尔!小罗一针见血:他俩根本不是一个维度

体育闲话说
2026-03-19 13:55:21
《求是》再提房地产,房地产是居民财富的重要来源

《求是》再提房地产,房地产是居民财富的重要来源

地产观点
2026-03-19 17:44:00
给演“伟人”的5位演员排名:唐国强第五,古月仅第二,第一是谁

给演“伟人”的5位演员排名:唐国强第五,古月仅第二,第一是谁

琨玉秋霜
2026-03-16 17:07:00
女篮队长!杨舒予官宣签阿迪达斯 入选最佳阵容率队进世界杯

女篮队长!杨舒予官宣签阿迪达斯 入选最佳阵容率队进世界杯

醉卧浮生
2026-03-19 18:00:29
湖人6连胜又一关键!东契奇防守进步突出:防单打数据超阿门麦丹

湖人6连胜又一关键!东契奇防守进步突出:防单打数据超阿门麦丹

罗说NBA
2026-03-19 08:48:47
特朗普称正考虑进一步打击伊朗现政权

特朗普称正考虑进一步打击伊朗现政权

新京报
2026-03-18 20:30:10
沈阳至大连之间高铁价格涨价了

沈阳至大连之间高铁价格涨价了

沈阳生活圈i
2026-03-19 16:18:41
别被误导了!根本没有“农民养老金”,农村老人领的钱其实是这个

别被误导了!根本没有“农民养老金”,农村老人领的钱其实是这个

三农雷哥
2026-03-18 14:38:12
二月二龙抬头!一不穿、二不吃、三人不剃头,这些人千万别犯忌!

二月二龙抬头!一不穿、二不吃、三人不剃头,这些人千万别犯忌!

老特有话说
2026-03-18 15:02:38
对标京津城际?越南首条全长120公里350km/h高铁将于4月12日开工

对标京津城际?越南首条全长120公里350km/h高铁将于4月12日开工

小蜜情感说
2026-03-19 13:00:33
高市早苗专机抵达华盛顿,还没见到特朗普,先等来了中俄各上一课

高市早苗专机抵达华盛顿,还没见到特朗普,先等来了中俄各上一课

叮当当科技
2026-03-19 19:35:03
唐钱婷刷新亚洲纪录!

唐钱婷刷新亚洲纪录!

五星体育
2026-03-19 12:00:26
富时中国A50指数期货直线拉升转涨

富时中国A50指数期货直线拉升转涨

界面新闻
2026-03-19 09:51:26
高一重点班儿子突然躺平,40岁爸爸绝望痛哭:养娃,千万别硬扛

高一重点班儿子突然躺平,40岁爸爸绝望痛哭:养娃,千万别硬扛

新东方家庭教育
2026-03-16 17:16:47
列国鉴|霍尔木兹海峡,地缘博弈与经济命脉的交织点

列国鉴|霍尔木兹海峡,地缘博弈与经济命脉的交织点

新华社
2026-03-13 17:53:11
2026-03-19 21:07:00
车云网 incentive-icons
车云网
中国第一汽车科技网站
12816文章数 250972关注度
往期回顾 全部

科技要闻

拆解腾讯2025财报:一场代价千亿的AI豪赌

头条要闻

知名主持人三亚潜水被拔呼吸器 对方问他"拍不拍照"

头条要闻

知名主持人三亚潜水被拔呼吸器 对方问他"拍不拍照"

体育要闻

他们专卖“老头鞋”,却能签下19岁NBA未来门面?

娱乐要闻

戴军55岁再翻红!与何炅传闻意难平

财经要闻

伊朗战争会是"美国金融危机"导火索吗?

汽车要闻

不到10万还有激光雷达 零跑A10体验超预期

态度原创

健康
教育
亲子
家居
房产

转头就晕的耳石症,能开车上班吗?

教育要闻

宝妈必学,别等霸凌严重了才去处理!

亲子要闻

幸福一直环绕着我

家居要闻

奶棕撞色 轻法轻奢风

房产要闻

格局打开!三亚四代宅,被这个新盘狠狠破局!

无障碍浏览 进入关怀版