网易首页 > 网易号 > 正文 申请入驻

陈天桥入局小模型,用 30B 跑赢万亿

0
分享至


2026 年小模型或成为关键。


作者|徐珊

编辑|郑玄

如果说 2025 年 DeepSeek 的爆发让全球意识到算力并非通往 AGI 的唯一方式,那么 2026 年开年,MiroThinker 1.5 的发布,让人更关注小模型的潜力所在。

MiroThinker 1.5 是盛大集团创始人陈天桥与 AI 科学家代季峰创办的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通过 其 30B 小模型规格,通过极小的算力调度,在复杂推理任务中取得了不输大模型的表现,同时响应速度更快、成本更低、智能表现效果更好。目前,MiroThinker 1.5 正处于公开发布阶段,人人皆可上手免费使用。

除了 MiroThinker 1.5 性能表现优越以外,MiroThinker 备受关注的另一大原因是,这是一个强强联手打造出来的创业项目。

MiroMind 是陈天桥在 AI 领域,少有的,自己下场主导并参与的创业项目,他曾凭借《传奇》缔造网游神话、登顶中国首富。在淡出中心视野这些年里,他扎进脑科学领域,砸下十亿美金建立 TCCI,试图挖掘人类大脑的秘密。

公司的另一个创始人则是代季峰,从微软亚洲研究院到商汤科技,一直扎根在计算机视觉领域。他主导过 InternVL 等开源项目,是物体检测与具身智能领域的风云人物。两者组合,让 MiroThinker 1.5 哪怕只是刚上线不久,也得到业内不少关注。


图片来源: MiroMind 官网

不过,如果小模型的性能真的能够与大模型相媲美,Agent 或许将会迎来一轮落地爆发,随着 Agent 真正完成端侧落地,AI 硬件的能力与玩法,或许也会迎来新一轮的变革。

01

梁文锋牵线搭桥,

MiroMind 想要成为下一个 DeepSeek


就在前不久,MiroMind 首席科学家代季峰在知乎上亲自下场,还原了这段颇有江湖色彩的创业故事。

出人意料的是,为 MiroMind 两位核心人物牵线搭桥的正是 DeepSeek 的掌门人梁文锋。

2025 年初,当陈天桥目睹了 DeepSeek 能力后,就意识到通往 AGI 的道路已开始明晰。当发现自己完全有能力打造下一个 DeepSeek 时,他询问梁文锋,谁最适合带队冲刺 AGI?梁文锋当时就推荐了代季峰,陈天桥没有任何迟疑,直接锁定了他,两人联合创办了 MiroMind。

据代季峰回忆道,在创业前最关键的那场谈话中,没有冗长的商务谈判,只有相见恨晚的共鸣。

当时,陈天桥问代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因为梁文锋一人集齐了「有钱、有理想、懂技术」三个要素,沟通与管理的成本降到极限。代老师随后坦诚相待说:「我有理想和技术,但唯独少了点『资金』。」陈天桥对此相视一笑提到,「我有资本,有对 AGI 的执着理想,但确实缺一位懂技术的领路人。」

这种各有所长的组合,补齐了他们通往 AGI 创业道路的最后一块拼图。代季峰在组建团队时,带有一种近乎纯粹的「少年感」,他提到自己不需要那种在大厂下午发消息、深夜十点才带着满身疲惫回家的员工,而是更希望团队伙伴们都能做到「眼里有光」的状态。


图片来源:清华大学官网

在选择究竟以什么方向切入赛道时,代季峰很清醒地意识到,现在 LLM 预训练的曲线已经走到了极其平缓的平台期,作为一个后来者,选择再去大模型赛道拼参数并没有意义。

于是,MiroMind 毅然选择杀入了刚兴起的 Agent Modeling 赛道,他们想看看,如果不再推崇算力至上,而是追求最懂、最实用的模型,能不能在 Agent 时代跑出一条不一样的生路。

02

模型参数量降至 1/30,

成本下降 1/20


过去七个月,MiroMind 一直在思考一个更为根本的问题:智能的「奇点」究竟在哪里?

最后他们给出的的答案并非是「用参数推出世界记忆模型」,而是追求「发现智能」。

他们在官网中写道:真正的智能并非依赖于全知全能,而是依赖于研究、验证和纠正的能力。因为真正的智能不是过目不忘的死记硬背,而是像科学家一样,在不确定性中通过纠错抵达真相。

MiroThinker 1.5 测试的最终的效果,也非常令人欣喜。面对万亿级参数的 Kimi-K2-Thinking,仅有 30B 参数规模的 MiroThinker-v1.5 表现出了相当的推理水平。而最直观的表现是模型性能与模型成本成倒挂的态势,在衡量搜索代理能力的基准测试 BrowseComp-ZH 中,30B 版本的表现位列全球前列。


BrowseComp 基准测试的性能比较 |图片来源:MiroMind 官网

由于参数量缩减到对方的 1/30,MiroThinker 1.5 30B 调用成本大幅下降至每次 0.07 美元,仅为万亿模型成本的 1/20,且推理速度更快。


智能搜索基准测试的性能比较|图片来源:MiroMind 官网

MiroMind 在官网解释了自己的设计思路与原理。他们认为传统的 Scaling Law 路径倾向于将尽可能多的人类知识记忆在模型参数中。这种做法的弊端在于,当模型面对未知领域或实时变动的信息时,往往会基于统计概率「捏造」答案,从而产生幻觉。而 MiroMind 团队则将技术重点放在了交互式缩放(Interactive Scaling)上。

具体而言,在技术实现上,MiroThinker 1.5 引入了几个核心的新机制:

  • 交互式推理闭环:模型不再进行简单的线性思维链(CoT)外推。它构建了一个「提出假设—查询外部数据—发现冲突—修正假设」的研究循环。在得出结论前,模型会主动发起多轮外部检索,利用确定性的外部证据流来抵御不确定的内部推理偏差。

  • 证据驱动的训练机制:在训练阶段,团队改变了奖励函数。系统不再单纯奖励答案的正确性,而是强化模型搜寻证据的行为。缺乏来源支持的高置信度输出会被惩罚,这迫使模型形成一种「先验证、后判断」的本能。

  • 时间敏感型训练沙箱:为了解决 AI 的「后见之明」问题,标准训练中,模型通常能看到数据的最终结果,这使其在预测未来时倾向于先「回忆过去」。简单来说,MiroMind 构建了一个沙箱,严格限制模型只能访问特定时间戳之前的信息,迫使它在信息不完整、存在延迟的真实环境下学习推理和纠错。

如此一来,MiroThinker 1.5 不再是一个试图记住所有百科知识的容器,而是一个擅长使用工具的专业研究员。在处理金融分析、时效性预测等任务时,它能够展示完整的逻辑验证链条。


演示提问:下周有哪些重大事件可能会影响美国纳斯达克指数?|图片来源:MiroMind 官网

03

通往 AGI 的另一种道路

MiroThinker 1.5 的出现,在行业内引发了一定反响。不少业内人士认为,AI 竞争即将从拼参数拼规模的时代,转向「拼智力」的时代。

随着模型参数规模的持续下降和推理成本的边际递减,2026 年小模型或成为关键。当 AI 模型的参数规模最够小、价格最够低,且表现性能足够好时,能够更高效地集成进各类移动终端和边缘设备中,那么 AI 落地硬件的算力门槛问题将会迎刃而解。那些已经在大厂实验室、初创公司里打磨了一两年的 AI 硬件,才算真正具备了底层技术支撑,迎来了真正的「开智」时刻,且能够进一步迎接更丰富的功能,更有趣的交互设计。

就如同电力时代刚开启时,人类必须依赖庞大的变压器和错综复杂的电网供电,那时的电力是昂贵且固定的。但当电池技术成熟、电力变得可随身携带后,电器才真正爆发并改变了每一个人的生活。如今的大模型就像初期的电网中心,而 MiroThinker 1.5 这样的小模型,则更像随处可见的「电池」。

可以预见的是,2026 年,AI 变革将不再仅仅局限于行业内部的技术狂欢,而是会通过手机、眼镜、穿戴设备等每一个真实的硬件入口,触达每一个普通人。当 AI 能够以极低的成本在端侧实时运行、自主研究并解决问题时,所有人都会比以往任何时候,都更直观地感受到 AI 时代对生活的影响。

*头图来源:MiroMind

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你看好 MiroThinker 1.5 吗?

未来 AI 在微观型操作上,占比将被大大压缩,转而提升构建角色交流感。

点赞关注极客公园视频号,

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

等风来育儿联盟
2025-08-01 12:21:35
这条荒唐新闻,引起公愤了!

这条荒唐新闻,引起公愤了!

胖胖说他不胖
2026-01-11 10:00:11
董路:输U16国足2-5、输U23国足0-1,澳大利亚足球到头了!

董路:输U16国足2-5、输U23国足0-1,澳大利亚足球到头了!

绿茵舞着
2026-01-11 22:32:58
国乒新教练班子空留两岗位是最大看点 马龙樊振东或以双重身份回归

国乒新教练班子空留两岗位是最大看点 马龙樊振东或以双重身份回归

劲爆体坛
2026-01-12 19:22:18
金球奖这一夜,国际女星个个风情万种,但都被一位中国女星艳压了

金球奖这一夜,国际女星个个风情万种,但都被一位中国女星艳压了

八卦南风
2026-01-12 16:25:50
洗碗机大反转!砸家男越看越冤,知情人曝更多,难怪丈夫会崩溃

洗碗机大反转!砸家男越看越冤,知情人曝更多,难怪丈夫会崩溃

八斗小先生
2026-01-10 15:30:07
3:2!熊皇破荒难救主 拉神双响主导走势 巴萨击败皇马卫冕超级杯

3:2!熊皇破荒难救主 拉神双响主导走势 巴萨击败皇马卫冕超级杯

阿超他的体育圈
2026-01-12 05:10:31
“以为眼花了”,山东气温将飙到17℃!天气上演超级过山车:下一波雨雪在路上;烟威的雪为何下到“冒烟”?

“以为眼花了”,山东气温将飙到17℃!天气上演超级过山车:下一波雨雪在路上;烟威的雪为何下到“冒烟”?

鲁中晨报
2026-01-12 18:49:10
周杰伦宣布以球员身份参加澳网

周杰伦宣布以球员身份参加澳网

现代快报
2026-01-12 16:26:09
哭穷炫富,“知三当三”,装了10年的吉克隽逸,还是“自食恶果”

哭穷炫富,“知三当三”,装了10年的吉克隽逸,还是“自食恶果”

顾史
2025-12-12 14:59:24
马筱梅晒婴儿服,豪宅内景被看光,她不让汪小菲在台北买房是对的

马筱梅晒婴儿服,豪宅内景被看光,她不让汪小菲在台北买房是对的

韩驰
2026-01-10 13:12:31
2012年安徽30岁医学博士孕期瘫痪,生子后丈夫提离婚,如今翻盘​

2012年安徽30岁医学博士孕期瘫痪,生子后丈夫提离婚,如今翻盘​

小熊侃史
2026-01-12 07:35:07
周恩来的母亲万冬儿有多美?才华横溢眉目如画,30岁因肺结核去世

周恩来的母亲万冬儿有多美?才华横溢眉目如画,30岁因肺结核去世

芊芊子吟
2026-01-06 13:50:03
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
又是明尼阿波利斯!美ICE执法人员当街射杀女子事件仍在发酵,全美上千场抗议爆发

又是明尼阿波利斯!美ICE执法人员当街射杀女子事件仍在发酵,全美上千场抗议爆发

新民周刊
2026-01-12 16:45:52
就在刚刚,24家A股上市公司发布重大利好消息,看看都有哪些?

就在刚刚,24家A股上市公司发布重大利好消息,看看都有哪些?

股市皆大事
2026-01-12 08:26:49
中国出手了!石平之子录取资格被取消,女儿在机场被拦,太解气了

中国出手了!石平之子录取资格被取消,女儿在机场被拦,太解气了

小lu侃侃而谈
2026-01-12 19:56:41
震撼!曾精确预言911的盲眼神婆预测今年8大事件,有一条暗指中国

震撼!曾精确预言911的盲眼神婆预测今年8大事件,有一条暗指中国

刀刃故事
2024-11-22 01:55:03
两岸喜讯!大陆没想到,没等正式收台,台当局先送来2份“大礼”

两岸喜讯!大陆没想到,没等正式收台,台当局先送来2份“大礼”

趣生活
2026-01-10 22:29:06
天津宜家乱成一锅粥,还有人总结了攻略...

天津宜家乱成一锅粥,还有人总结了攻略...

全接触狐狐
2026-01-12 09:34:14
2026-01-12 21:28:49
极客公园
极客公园
让最棒的创新成为头条
11718文章数 78748关注度
往期回顾 全部

科技要闻

面对SpaceX疯狂“下饺子” 中国正面接招

头条要闻

女子坐火车遇71岁初中班主任 被一口叫出名字感动落泪

头条要闻

女子坐火车遇71岁初中班主任 被一口叫出名字感动落泪

体育要闻

聪明的球员,不是教练教出来的

娱乐要闻

蔡少芬结婚18周年,与张晋过二人世界

财经要闻

倍轻松信披迷雾 实控人占用资金金额存疑

汽车要闻

增配不加价 北京现代 第五代 胜达2026款上市

态度原创

亲子
本地
艺术
公开课
军事航空

亲子要闻

宝妈必学,伤害孩子的坏人不分性别!

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

艺术要闻

画完这组画,他抑郁了,后来自杀了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

官方确认:歼10CE在空战中击落多架战机

无障碍浏览 进入关怀版