网易首页 > 网易号 > 正文 申请入驻

刚刚,蝉联Future X全球榜首MiroMind发布全球最强搜索智能体模型

0
分享至

来源:市场资讯

(来源:机器之心Pro)


机器之心发布

凭借成功预测 Polymarket 题目,连续登顶 Future X 全球榜首的 MiroMind 团队,于今日(1 月 5 日)正式发布其自研旗舰搜索智能体模型 MiroThinker 1.5。

MiroMind 由全球知名创新企业家、慈善家陈天桥,与清华大学知名 AI 青年学者代季峰教授联合发起。去年陈天桥提出发现式智能才是真正意义上的通用人工智能这一重磅创新理念,引发全球业内人士关注。他同时提出建设发现式智能的 5 种关键能力,其中一项能力是在未知条件下重建对世界的理解,这正是 MiroMind 的使命。

在过去 7 个月里,当全行业都在「卷」参数规模、「卷」百万长文本的红海时,MiroMind 却在思考一个更本质的问题:智能的「奇点」究竟在哪里?他们给出的答案不是「把世界背进参数里」,而是押注「发现式智能」:真正的智能不靠全知,而靠会研究、会查证、会修正—— 像顶级情报官一样对外极速取证、对内严苛去伪存真;像严谨研究员一样在不确定性里逼近真相,最终把「预测未来」从特权变成能力。

MiroThinker 1.5 性能评测

MiroMind 团队在 AGI 竞技场上,不信奉 “大力出奇迹”,而是追求以高智效比为核心的 「巧劲」。

MiroThinker-v1.5-30B 仅用 1/30 的参数规模跑出了比肩众多 1T 模型的性能表现,其 235B 的版本在多个搜索智能体基准测试中跻身全球第一梯队。

实力霸榜:指标是门槛,预测是天花板


BrowseComp 性能对比


Agent 搜索评测基准性能对比

越级挑战:MiroThinker-v1.5-30B vs Kimi-K2-Thinking

面对参数量高达 30 倍的万亿参数巨兽 Kimi-K2-Thinking,MiroThinker-v1.5-30B 用极低的成本展示了旗鼓相当的表现:

核心洞察:从 「做题家模式」 转向 「科学家模式」

MiroMind 团队指出,以扩大模型内部参数量(Internal Parameters)为核心的传统 Scaling Law 已明显触及边际瓶颈;要继续提升模型性能,必须从「内部参数扩张」转向以「外部信息交互」(External Interaction)为核心的Interactive Scaling,将智能的增长空间从内部参数扩展到外部世界。

为什么该模型能在大幅降低成本的同时,性能依然能打?

因为这不是「大参数碾压」,而是一次「科学家模式」对「做题家模式」的胜利。以 Scaling Law 为代表的路线,更像「做题家」:试图把全人类知识(也包括噪声与错误)尽可能背进模型里;一旦遇到生物学等领域的未知问题,就容易基于概率分布「编」出一个看似合理的答案 —— 幻觉往往由此产生。

MiroThinker 1.0中,MiroMind 团队首次系统性提出Interactive Scaling:随着工具交互频率与深度提升,研究式推理能力也稳定增强 —— 这构成了与模型大小、上下文长度并列的第三个可扩展维度。v1.5 更进一步,把这套机制内化为贯穿训练与推理全流程的核心能力:将模型训练成「科学家」,核心不是死记硬背,而是勤查证。遇到难题时,它不会给出概率最高的瞎猜,而是执行慢思考的研究闭环:提出假设 → 向外部世界查数据 / 取证 → 发现对不上 → 修正假设 → 再查证,直到证据收敛。

主流大模型往往盲目追求万亿参数,试图把整个互联网「背」在脑子里。而 MiroThinker 系列选择了一条反共识的路线:刻意将模型控制在 30B–200B 的轻量级规模。MiroMind 团队强调,省下的不是算力,而是把算力花在了更刀刃的地方 —— 对外的信息获取与交互。

MiroMind 团队不追求让模型拥有一颗「最重的脑子」,而是培养它拥有一双「最勤的手」。当模型同时具备研究式确认机制时序因果约束,这种围绕外部信息获取的交互过程才让「发现式智能」真正落地 —— 也正是对 Interactive Scaling 的深耕,使他们用小得多的模型,做到了大模型才能做到的事。

MiroThinker 1.5 核心技术揭秘

传统的模型思维链本质上是在模型内部知识空间的线性外推,推理偏差会随路径增长而不断累积,最终导致逻辑坍塌。

MiroThinker 1.5 的核心发力点,在于通过 Interactive Scaling 打破孤立推理的僵局,将「推理」与「外部环境」深度耦合。通过构建「推理 - 验证 - 修正」循环,引入外部信息作为校验锚点,用确定性的证据流来对冲不确定性的推演,解决逻辑坍塌问题。

Training-time Interactive Scaling 技术

当智能的 Scaling 范式不再局限于模型内部庞大的世界知识储备与缜密的长程逻辑推理,而是依托模型高频与外部世界中探索与交互并获得闭环反馈时,小而高效的探索者模型能展现比肩于甚至超出大而严谨的思考者模型的智力水平。

MiroThinker 1.5 正是基于这一判断,将 Interactive Scaling 从推理阶段的外挂能力,前移并内化为训练阶段的核心机制。模型并非被要求「尽量在脑中想清楚一切」,而是被系统性地训练成一个善于向外求证、敢于否定自己、能够快速修正路径的 Agent。

在训练过程中,MiroMind 团队刻意削弱对「单次完美推理」的奖励,转而强化以下行为模式:

通过这种训练方式,MiroThinker 1.5 逐步形成了一种「本能反应」:在不确定性面前,先交互、再判断;在高风险结论前,先查证、再收敛。这使得模型不再需要将庞大的世界知识全部内化为参数,而是学会在需要时,快速、精准地向外部世界「借力」。

最终,团队用更小的参数规模,换来了更高的智能密度:不是让模型记住更多,而是让它学会如何找到、验证并使用信息。这正是 MiroThinker 1.5 能在显著降低推理成本的同时,依然保持一线性能的根本原因。

时序敏感训练沙盒

时序敏感训练沙盒,是破解「因果律」的钥匙:普通大模型训练常处在「上帝视角」—— 它在数据里早已「见过结果」,学到的往往是复述与「剧透」,而不是预测。MiroThinker 的训练则约束模型「只能看过去,不能看未来」,在严格的时间可见性约束下做判断、再用同样受时序约束的证据去验证与更新。

在这种训练范式下,模型被迫学会在信息不完备、噪声存在、信号延迟的真实条件下进行推演与修正,而不是依赖静态数据集中的「标准答案」。时间由此从一个背景变量,转变为塑造模型行为与推理方式的核心约束,使模型更接近真实世界中的认知与决策过程。

样例展示

Case 1: A 股涨停板预测

据介绍,这不是 「玄学」,更不是事后诸葛亮 —— 而是在信息极度噪声化、情绪快速切换的盘面里,用开放世界证据 + 因果推断去赌 「次日正确答案」。(注:以下仅为技术展示,不构成投资建议)


对话链接:https://dr.miromind.ai/share/07430808-d84d-4e40-9615-bf07d6e71365


对话链接:https://dr.miromind.ai/share/eccc29b9-889b-43f9-b6bf-f4b2b7c8dc1e


对话链接:https://dr.miromind.ai/share/e9db058d-3e8c-4922-b483-cf5efae2f414


对话链接:https://dr.miromind.ai/share/3dc7dae0-78cb-4a97-8f61-359ab2d3e1a0

Case 2: 下周有哪些大事件会对美股七巨头产生影响?预期的市场反应和潜在波动方向是什么 ?


对话链接:https://dr.miromind.ai/share/f4afae1a-21e1-4f6d-8eef-16909c2d7b79

Case 3: GTA 6 明年能按时发布吗?


对话链接:https://dr.miromind.ai/share/10e5d1fd-c6b6-4b96-a2ed-4b776a3e1dcd

人才招募

MiroMind 面向全球持续招募人才,简历投递:talent@miromind.ai

产品体验

立即体验 MiroMind,免费解锁预测未来的能力: https://dr.miromind.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小米,这次不是别人黑你们了吧!

小米,这次不是别人黑你们了吧!

亮见
2026-01-07 14:48:20
狂轰22三分!太阳7人上双大胜灰熊 狄龙21+7布克仅15中6

狂轰22三分!太阳7人上双大胜灰熊 狄龙21+7布克仅15中6

醉卧浮生
2026-01-08 12:06:00
特朗普与哥伦比亚总统佩特罗首次通电话!委代理总统强调:营救马杜罗夫妇等!美宣称将“无限期”控制委石油销售

特朗普与哥伦比亚总统佩特罗首次通电话!委代理总统强调:营救马杜罗夫妇等!美宣称将“无限期”控制委石油销售

每日经济新闻
2026-01-08 10:06:40
贝尔戈米:国米下轮踢那不勒斯不是决定性的;国米得买右翼卫

贝尔戈米:国米下轮踢那不勒斯不是决定性的;国米得买右翼卫

懂球帝
2026-01-08 10:33:20
三亚一游客称被司机诱导就餐,4道海鲜1868元,职能部门:会积极处理

三亚一游客称被司机诱导就餐,4道海鲜1868元,职能部门:会积极处理

环球网资讯
2026-01-07 13:36:42
王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳

王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳

愿你余生安好嘴角带笑
2026-01-08 08:23:42
知名奶粉爆雷,含致病菌隐患威胁孩子健康,很多家庭仍在使用

知名奶粉爆雷,含致病菌隐患威胁孩子健康,很多家庭仍在使用

八斗小先生
2026-01-07 15:33:33
20岁女大学生治疗精神病出院5天后坠亡,被认定一级甲等医疗事故,医院承担次要责任,家属申请刑事立案监督

20岁女大学生治疗精神病出院5天后坠亡,被认定一级甲等医疗事故,医院承担次要责任,家属申请刑事立案监督

大风新闻
2026-01-07 17:26:05
白宫发出军事威胁,丹麦希望“澄清误解”,“美国需要格陵兰岛”令欧洲为难

白宫发出军事威胁,丹麦希望“澄清误解”,“美国需要格陵兰岛”令欧洲为难

环球网资讯
2026-01-08 07:11:06
《爱情公寓》陈美嘉饰演者被曝怀孕!本人亲自出面回应,肚子确实变大了,但没情况

《爱情公寓》陈美嘉饰演者被曝怀孕!本人亲自出面回应,肚子确实变大了,但没情况

不八卦掌门人
2026-01-08 11:10:08
谁给了这些骗子的胆量,让其敢如此大胆,长期招摇撞骗?

谁给了这些骗子的胆量,让其敢如此大胆,长期招摇撞骗?

青锋看天下
2026-01-07 08:30:03
韩国人为何集体破防?他们终于发现:原来韩国的“根”在中国!

韩国人为何集体破防?他们终于发现:原来韩国的“根”在中国!

流云随风去远方
2026-01-05 03:15:48
超低级错误!罗技忘记更换SSL证书:Options+/G Hub全部没法用

超低级错误!罗技忘记更换SSL证书:Options+/G Hub全部没法用

快科技
2026-01-07 17:49:05
普通车厢站不直,商务车厢能打盹?深圳地铁11号线车厢设置引热议,地铁回应:没有取消计划

普通车厢站不直,商务车厢能打盹?深圳地铁11号线车厢设置引热议,地铁回应:没有取消计划

大风新闻
2026-01-07 21:36:03
午后突变!贵金属,全线跳水!

午后突变!贵金属,全线跳水!

证券时报
2026-01-07 14:55:07
王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳了

王毅外长发出统一最强音,向全世界通报两件事,中国再也不避讳了

议纪史
2026-01-07 12:20:03
可以归化!中超顶级外援:我爱中国,喜欢中华文化,儿子会说汉语

可以归化!中超顶级外援:我爱中国,喜欢中华文化,儿子会说汉语

国足风云
2026-01-08 09:02:38
小米深夜通报处罚,辞退涉事人员、公关总经理徐洁云遭重罚,祸及46号员工许斐!网友:这才是弃轮保车

小米深夜通报处罚,辞退涉事人员、公关总经理徐洁云遭重罚,祸及46号员工许斐!网友:这才是弃轮保车

大白聊IT
2026-01-07 10:25:56
被质疑豢养很多kol!小米高管:没包养过谁,和大熊接触是昏招…

被质疑豢养很多kol!小米高管:没包养过谁,和大熊接触是昏招…

柴狗夫斯基
2026-01-07 09:52:09
250万捡到宝!巴萨20岁前锋狂飙: 1球2助9.2分 冲击第1冠

250万捡到宝!巴萨20岁前锋狂飙: 1球2助9.2分 冲击第1冠

叶青足球世界
2026-01-08 08:31:34
2026-01-08 12:24:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1950681文章数 5188关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

美国高官谈对委行动:主宰世界的是实力、武力与权力

头条要闻

美国高官谈对委行动:主宰世界的是实力、武力与权力

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

本地
手机
时尚
教育
公开课

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

手机要闻

6.99mm影像旗舰!联想moto X70 Air Pro DXO评分出炉:164分并列第六

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

教育要闻

赤裸裸的现实!孩子入职中国电信县公司一年,气到想要离职

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版