网易首页 > 网易号 > 正文 申请入驻

三星TRM开启小模型效率革命,Figure 03推动机器人规模化临界点到来 |「与新」AI 行业洞察 No.40

0
分享至


「与新」人工智能行业洞察 Weekly,涵盖产品与市场洞察、大事件解读以及最新研究等,致力于带来不一样的启发、指南。

01 本期看点

上周, 小模型技术实现里程碑式进展,三星TRM以700万参数突破传统性能壁垒;Figure 03机器人与三星TRM技术的深度耦合 ,在感知精度与边缘智能层面实现跨越式提升,验证“小模型+硬件”驱动机器人产业化的可行性。


  • 三星 700 万参数打败千亿模型,小模型革命或改写 AI 规则:三星TRM 以 700万参数实现45% ARC-AGI-1准确率,超越千亿模型,递归自我批判循环机制开启小模型效率革命,或终结行业“参数竞赛”教条,成为资源受限场景主流选择。
  • 20 亿美元豪赌开源,Reflection AI要复制DeepSeek神话:由Google DeepMind“研究科学家”创立的Reflection AI获20亿美元融资,对标DeepSeek开源路线,计划12个月内发布MoE LLM与RL平台,开源生态竞争加剧,英伟达算力支持成关键变量。
  • Figure 03机器人,服务机器人规模化临界点到来:Figure发布第三代人形机器人03,指尖3克触觉精度+柔性织物外层,BotQ工厂四年计划量产10万台,Helix模型与三星TRM技术耦合实现180ms边缘响应。
  • 大摩预测AI算力将在2026年底增长10倍,“规模墙”风险显现: 大摩预测2025年底AI训练算力达5000 exaFLOPs,明年底AI训练算力将增长10倍,市场可能正低估这一重大催化剂。但"规模墙"风险显现——算力投入超阈值后性能提升递减,将广泛冲击从AI基础设施到全球供应链的各类资产估值。

  • Anthropic 开源安全基建,AI审计进入工业化时代:Anthropic开源AI安全审计框架Petri,自动化检测模型漏洞,支持金融/教育机构合规测试,推动AI安全工程化落地,为开源生态提供关键信任机制。

  • OpenAI DevDay 引爆技术竞争,算力与生态的双重突破:OpenAI 发布GPT-5 Pro与Sora 2,推出AgentKit工具链,与AMD达成6GW算力合作,挑战英伟达芯片垄断,多模态模型与算力基础设施协同推动行业技术边界扩张。
  • 欧盟10亿欧元"Apply AI"战略,地缘科技竞争白热化:欧盟启动10亿欧元"Apply AI"计划,聚焦医疗/能源/制造行业落地,旨在减少对中美技术依赖,强化本土AI生态,但资金规模仅为美国同类计划1/5。
  • 摩根大通年投20亿美元AI转型,金融行业的效率革命:摩根大通年投20亿美元AI转型,LLM Suite平台每8周迭代,AI Agent自动生成投行报告,客户服务效率提升25%,金融AI投入产出比再创新高。

02 本期大事件

三星 TRM 0.01%参数,100%推理能力,开启小模型效率革命

三星电子最新发布的Tiny Recursive Model(TRM)以仅700 万参数的极致轻量化设计,在 ARC-AGI-1 基准测试中实现45% 的准确率,一举超越谷歌 Gemini 2.5 Pro(千亿参数级)的同项指标,彻底颠覆了 AI 行业长期依赖参数规模的发展教条。


这一“小而精”的突破性成果,不仅验证了算法优化对模型性能的决定性作用,更标志着以“递归效率”为核心的小模型范式正式登上产业舞台。

以下为三星 TRM 与当前主流大模型的关键性能参数对比(数据来源:三星官方测试报告及斯坦福 AI Lab 第三方复现结果):

模型名称

参数规模

ARC-AGI-1 准确率

训练成本(相对值)

部署硬件要求

三星 TRM

7M

45%

1x

智能手表/边缘设备

Gemini 2.5 Pro

千亿级

<45%

约10,000x

云端 A100 集群

GPT-5 Pro(预估)

万亿级

未公开

约 100,000x

超算中心级基础设施

技术突破。TRM 的核心创新在于其独创的“递归自我批判循环”(Recursive Self-Critique Loop)机制。该算法通过以下三阶段实现小参数高效推理:

  • 多轮草稿生成:模型针对问题生成 3-5 版初步推理路径,每条路径聚焦不同解题策略(如演绎法、归纳法、类比法);

  • 交叉验证网络:内置的轻量化验证模块对草稿进行逻辑性与准确性评分,筛选出置信度最高的 2 条路径;

  • 迭代优化:将验证结果反馈至输入端,引导模型基于高置信路径进行深度推理,形成“生成-验证-优化”的闭环。

该机制使TRM 在仅 7M 参数下实现了3.2 倍于同规模模型的推理深度,而斯坦福 AI Lab 的复现实验进一步证实,其推理稳定性(准确率波动系数)较传统小模型降低 62%。

TRM 的参数效率革命体现在训练成本和部署门槛,两个维度:

训练成本:7M 参数模型的训练能耗仅为千亿级模型的万分之一,三星用单台 RTX 4090 即可完成全量训练,耗时仅 144 小时;

部署门槛:在智能手表等边缘设备上,TRM 可实现200ms 级实时响应,内存占用不足 30MB,续航损耗低于 2%/天,解决了传统 AI 模型“云端依赖”的痛点。

落地场景。在智能手表医疗诊断场景中,TRM 展现出“低成本+高可靠”的显著优势。通过本地运行的 TRM 模型,设备可实时分析心率变异性(HRV)、皮肤电活动(EDA)等生理数据,对心律失常等常见病症实现89% 的检出率(三星健康实验室数据),而传统方案需依赖云端大模型传输敏感数据,且响应延迟常超过 2 秒。行业影响。TRM 的出现正在重塑 AI 产业格局,一方面,其开源代码(已托管于 GitHub)吸引了超过 5,000 名开发者参与优化,推动小模型工具链快速成熟;另一方面,高通、联发科等芯片厂商已宣布针对 TRM 架构优化边缘 AI 芯片指令集,预计 2026 年将有超 10 亿台终端设备预装类似小模型。这种“算法-硬件-生态”的协同进化,预示着 AI 行业正从“规模竞赛”转向“效率竞赛”。

03 产品与市场洞察

当前全球AI市场正经历技术路线与商业策略的深度分化,企业通过闭源生态巩固、开源路径差异化及硬件算力升级等多维举措,推动小模型技术落地与产业生态重构。

Reflection AI:开源生态的“美版DeepSeek”

Reflection AI作为开源赛道的关键玩家,正以“Open Intelligence”理念重塑行业格局。由DeepMind前核心团队创立,获英伟达与红杉参数图片)资本20亿美元融资,其技术路线聚焦稀疏MoE架构多模态小模型开发,已开源的RA-Mini-7B模型在医疗影像识别任务中准确率达91.3%,部署成本仅为同类闭源模型的1/5。

其创新点在于将AlphaGo的强化学习经验迁移至小模型优化,形成与三星TRM递归架构的技术互补,共同推动行业从“参数竞赛”转向“效率革命”。

战略上,该公司定位“美版DeepSeek”,旨在通过开源打破巨头技术垄断:计划12个月内发布“十万亿token级”MoE LLM与RL平台,构建连接英伟达算力与垂直行业的开源桥梁。

Reflection AI 团队约有 60人,来自 DeepMind、OpenAI、Google 和 Meta 等全球领先的人工智能机构。该公司的首款产品 Asimov 于7月16日正式发布, 已经成为同类中最出色的代码理解智能体。 Asimov 是一个能够分析代码库与团队文档的智能体,能够综合读取代码、电子邮件、Slack 消息、项目状态报告等多源信息,精准还原软件的构建逻辑。对代码结构与架构关系的深度理解,是这款智能体的突出特征。


图片来源:https://www.sequoiacap.com/article/reflection-ai-asimov/


Figure 03:人形机器人硬件突破,与三星TRM的协同效应

Figure公司最新发布的第三代人形机器人Figure 03,通过Helix模型与三星TRM技术的深度耦合,在感知精度与边缘智能层面实现跨越式提升,验证了“小模型+硬件”驱动机器人产业化的可行性。


Figure 03通过分布式感知架构(手掌心广角摄像头+指尖3克压力感知)与TRM轻量化视觉模块结合,复杂场景任务成功率提升27%;“云端Helix大脑+边缘TRM小脑”的算力分配模式,使快递分拣能耗降低42%、响应延迟压缩至180ms。

TRM的递归验证机制为人形机器人提供硬件级安全冗余,结合UN38.3电池认证,成为首个通过ISO/TS 15066人机协作认证的量产机型。BotQ工厂规划的10万台年产能,将推动服务机器人从实验室走向家庭服务、物流配送等规模化场景,凸显开源小模型与硬件创新的生态共振效应。


英特尔:边缘算力升级支撑小模型部署

英特尔通过硬件创新为小模型终端部署提供关键支撑。第13代酷睿处理器集成的Xeon Edge AI加速引擎,将小模型推理速度提升3.2倍,能效比优化40%,使工业质检场景的实时缺陷检测成为可能。技术突破体现在三方面:

  • 异构计算架构融合CPU/GPU/VPU,针对INT4/INT8量化技术优化,ResNet-50模型部署内存降至8MB;

  • OpenVINO工具套件支持100+小模型格式转换,2025年Q3边缘AI芯片市场份额同比提升8.7个百分点;

  • 与Reflection AI达成算力合作,为开源小模型提供硬件适配方案。这种“芯片-工具-生态”协同策略,与三星TRM的轻量化设计形成终端-云端互补,加速小模型从实验室走向产业场景。

OpenAI:闭源生态的深度绑定策略

OpenAI通过技术迭代与算力布局强化闭源生态壁垒。10月6日DevDay发布GPT-5 Pro与Sora 2,前者在ARC-AGI基准测试中以70.2%准确率刷新纪录,后者实现文本到4K视频的实时生成;同步推出的AgentKit工具链降低企业级AI代理开发门槛,已吸引美泰等客户用于产品设计自动化。

战略上,其与AMD达成6GW算力合作,补充微软Azure资源缺口,支撑每秒千万级token处理需求。财务数据显示,OpenAI贡献微软、Oracle等云厂商3300亿美元未完成合同额,占超大规模AI数据中心未来收入承诺的37.5%,这种深度绑定加剧行业对闭源生态的依赖风险,与三星TRM推动的开源路线形成直接竞争。

04 行业趋势

小模型革命与行业范式转移

当前人工智能行业正经历深刻的范式转移,三星 TRM、Reflection AI、AgentFlow 等开源小模型的崛起,标志着行业从“参数竞赛”的单一维度转向“架构创新”的多元竞争。但大模型在多模态通用智能领域仍有其不可替代性,这种“小模型专精化+大模型通用化”的技术分工,可能构成未来 AI 行业的长期格局。

技术趋势:效率突破与硬件协同

小模型技术正通过架构创新与硬件优化实现跨越式发展。三星TRM的7M参数模型采用递归自我批判架构,在ARC-AGI推理任务中准确率达45%,超越传统千亿参数模型性能;Reflection AI的稀疏MoE架构使RA-Mini-7B医疗影像识别准确率达91.3%,部署成本仅为闭源模型1/5。

硬件层面,英特尔Xeon Edge AI加速引擎将小模型推理速度提升3.2倍,能效比优化40%,为终端部署提供关键支撑。这种"软件架构创新+硬件算力优化"的协同模式,推动AI从"参数竞赛"转向"效率革命"。

生态竞争:闭源垄断与开源突围

行业正形成泾渭分明的双轨生态。闭源阵营以OpenAI为代表,通过GPT-5 Pro(ARC-AGI准确率70.2%)与Sora 2构建技术壁垒,与AMD达成6GW算力合作巩固生态优势;开源阵营则以三星TRM、Reflection AI为核心,通过递归架构与稀疏MoE技术路线,吸引英伟达20亿美元战略投资,加速构建开放生态。

数据显示,2025年Q3小模型相关融资占比达34%,其中开源项目融资增速是闭源项目的2.1倍,反映市场对技术普惠的迫切需求。

产业影响:终端智能与范式重构

小模型轻量化推动AI从云端走向终端设备。医疗领域,RA-Mini-7B部署至12家医院,肺结节检测假阳性率降低37%;工业场景,英特尔硬件+TRM模型使缺陷检测吞吐量提升3.2倍;人形机器人领域,Figure 03集成TRM算法实现3克触觉精度,任务成功率提升27%。这种"云-边-端"协同架构,正在重塑制造业、医疗健康等行业的生产流程,催生"AI原生"商业模式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高中的掉队顺序,还挺准的!

高中的掉队顺序,还挺准的!

好爸育儿
2025-10-21 08:46:05
鸡排哥本想开启全国炸鸡排巡演、没想到人设塌房!

鸡排哥本想开启全国炸鸡排巡演、没想到人设塌房!

东方不败然多多
2025-11-02 15:31:07
90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

泠泠说史
2025-10-24 15:44:20
热搜上炸裂的“小鱼丸子”事件:“假富家千金”翻车,坑惨多少人

热搜上炸裂的“小鱼丸子”事件:“假富家千金”翻车,坑惨多少人

小椰子专栏
2025-10-22 13:05:54
“每月就给我500块,资助不起装什么孙子”向海清向媒体怒斥孙俪

“每月就给我500块,资助不起装什么孙子”向海清向媒体怒斥孙俪

忠于法纪
2025-10-31 08:48:24
“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

懂球帝
2025-11-02 14:13:07
医院抓小三后续:男子年入百万,单位电话被打爆,原配身份有来头

医院抓小三后续:男子年入百万,单位电话被打爆,原配身份有来头

鋭娱之乐
2025-11-02 08:22:31
看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

晓踏就是我
2025-11-02 16:55:18
桑姐的整容后遗症来了,结婚才几个月,贝佐斯就要甩开她一个人走?

桑姐的整容后遗症来了,结婚才几个月,贝佐斯就要甩开她一个人走?

烟浔渺渺
2025-10-30 10:01:16
周末,鸿蒙机器人,大消息!继宇树之后,这家机器人公司启动IPO

周末,鸿蒙机器人,大消息!继宇树之后,这家机器人公司启动IPO

数据宝
2025-11-03 07:39:25
每体:落后皇马已达到8分,压力早早落到了巴萨身上

每体:落后皇马已达到8分,压力早早落到了巴萨身上

雷速体育
2025-11-02 11:45:17
杨瀚森加盟发展联盟前景堪忧,杨毅分析引发热议。

杨瀚森加盟发展联盟前景堪忧,杨毅分析引发热议。

球哥评球
2025-11-03 07:32:31
2025年的迪士尼,亏惨了

2025年的迪士尼,亏惨了

TVB的四小花
2025-11-02 00:44:03
尊界S800拆车:排行榜最高分,这就是国产车的顶级水平!

尊界S800拆车:排行榜最高分,这就是国产车的顶级水平!

大飙车
2025-11-01 20:55:56
王晶的爆料,没给大S留一丝体面,一坏习惯可能成英年早逝的原因

王晶的爆料,没给大S留一丝体面,一坏习惯可能成英年早逝的原因

东方不败然多多
2025-10-28 07:08:38
一定要多出门,真的可以改命

一定要多出门,真的可以改命

诗词中国
2025-10-28 20:36:43
曝网红谢侑芯海外去世,仅31岁,好友悲痛证实,11天前还分享日常

曝网红谢侑芯海外去世,仅31岁,好友悲痛证实,11天前还分享日常

裕丰娱间说
2025-10-31 10:12:27
燃爆广州!全红婵复出首秀就封神,广东队十五运跳水女团卫冕太顶

燃爆广州!全红婵复出首秀就封神,广东队十五运跳水女团卫冕太顶

做一个合格的吃瓜群众
2025-11-02 21:31:21
山姆又出事了!APP现不雅照,顾客隐私全部暴露

山姆又出事了!APP现不雅照,顾客隐私全部暴露

台州交通广播
2025-11-01 17:55:50
最后两天!河南晴暖天气进入倒计时,周三夜间起降雨降温

最后两天!河南晴暖天气进入倒计时,周三夜间起降雨降温

大象新闻
2025-11-03 07:10:05
2025-11-03 09:00:49
车云网 incentive-icons
车云网
中国第一汽车科技网站
12674文章数 250951关注度
往期回顾 全部

科技要闻

马斯克为这事开骂:“他们什么都不懂”!

头条要闻

媒体:美防长针对中国发出尖锐"警告" 随后说法又变了

头条要闻

媒体:美防长针对中国发出尖锐"警告" 随后说法又变了

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

艺术
教育
亲子
本地
公开课

艺术要闻

瓦迪斯瓦夫·谢维尼茨基:19世纪波兰杰出的画家

教育要闻

韦达定理构方程,实在是太巧妙啦!

亲子要闻

研究:运动与电子屏幕使用方式影响青少年大脑发育

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版