网易首页 > 网易号 > 正文 申请入驻

美团悄悄开源重度推理模型!8个脑子并行思考,有点东西。

0
分享至

大家好,我是袋鼠帝。

2026年刚开年,AI圈子终于开始稍微安静一点了,不过各家似乎都在憋大招。

前两天我刷X的时候,发现美团居然悄悄咪咪又开源了一个新模型:LongCat-Flash-Thinking-2601。


不得不说,美团这个更新节奏是真滴卷。

我回忆了下,从去年9月发布Chat版本,到后来的Thinking版本,再到Omni全能版,他们的模型路走得非常稳。

这次的2601版本,更是全面提升了Agent和Thinking能力

不过真正吸引我去深入研究的,其实是 X 上的一条评论:它居然有8位思考者并行推理。


这一下子就勾起了我的好奇心,我们之前用的深度推理模式,大多是单线程的,就像一个人在走路,哪怕走得再快,也就是那一条路。

美团这个设计,像是直接开了一个AI专家团

趁着上周末去北京参加AIGC开发者大会的间隙,我把这个新模型好好研究了一下。

这一试,我发现它还真有点东西。

先给大家总结一下这次新模型更新的核心亮点(省流版):

1.泛化能力极强,在那种混乱的真实环境里表现很稳,在复杂随机任务中甚至优于Claude。

2.自动构建多个高质量环境;密集依赖关系图

3.多环境强化学习:扩展的DORA(我们的强化学习基础设施),支持大规模多环境智能体训练

4.核心创新叫Heavy Thinking Mode,也就是深度思考模式:

平行思维:通过多个独立的推理路径扩展思维广度

迭代式摘要:通过使用摘要模型来综合输出,增强深度,支持迭代推理循环。

在这个模式下,模型会启动并行思考,相当于你有多个不同领域的大脑在同时帮你琢磨同一件事。

另外,据说1M(100万)token的上下文版本也快来了。


光看参数也没意思,咱们直接上实测。

目前,深度推理模式可在LongCat AI平台免费体验

https://longcat.chat/

让美团AI团队解决问题

以后遇到问题不用焦虑了,可以试试美团这个AI团队,团队8人,效率极高,还有第9人是个小领导,总结发言,是个全方位思考的智囊团。



团建聚餐,专治众口难调

来个美团的拿手好戏,点餐

不过有点刁钻:

prompt:我们在深圳,有8个同事要聚餐,预算只有300元。小张不吃辣,小李对麸质过敏,小王必须喝冰美式,老板想吃地道的本地菜,剩下的4个人里有人在减肥,有人想吃重口味。请寻找最优性价比方案,并给出具体的点单组合和凑单攻略。

这要是让人来想,估计头发都得掉一把。

当时打开深度思考后,吓我一跳,原来这就是重度思考吗

屏幕上直接冒出来8条并行的思维链!直接多出来8个脑子


有一种从单行道突然变成8车道的开阔感

来看看 LongCat 的 8 位 Thinker 是怎么应对的。


它们分别给出了不同的策略:有的建议分开点外卖,有的推荐了性价比极高的潮汕套餐,还有的另辟蹊径建议去吃早茶。

这8个大脑并行工作完之后,还会有一个裁判角色的模型出来做总结,把各个方向的精华提炼出来,形成最终的答案。

俗话说三个臭皮匠顶个诸葛亮,美团这是直接给我安排了三个诸葛亮啊。

最后的综合方案很不错,模型经过权衡后发现,在深圳 300 块钱满足这么多人的堂食需求几乎是不可能的,所以最优解是点外卖,并且给出了具体的分店铺凑满减攻略。


最让我惊讶的是细节:它甚至提醒我,酱油里可能含有麸质,一定要给商家备注小李的过敏情况。

这种细致程度,单靠一条思维链是很容易遗漏的。这也体现了并行思考的优势:既有广度,又有深度。

而且速度依然很快,这也是我一直比较喜欢美团模型的一点,干活讲究效率


假如明天AGI到来?

前端时间,马斯克的访谈提到,AGI可能很快就会实现

所以我又问了一个稍微宏大一点的问题:假如明天AGI突然到来,世界会变成什么样?

这回的思维链就像是一场高质量的圆桌论坛,类似上周六我参与分享的圆桌会议

有的Thinker在分析对就业市场的冲击,有的在预测经济结构的重组,还有的在探讨人类认知的颠覆。


看着这 8 个大脑在屏幕上互搏,非常有意思。

它们各有各的观点,但最后又能达成某种共识。这和我们人类社会其实很像,真理往往就是在不断的辩论和碰撞中产生的。



法律智囊团:随身携带的律师天团

这个场景非常实用,假设我不小心在商场碰碎了一个标价8.8万的艺术品,商场态度强硬要我全额赔偿,那不是完犊子了?

我把情况描述给LongCat,让它做我的辩护律师。

prompt:我在商场行走时,背包不慎剐蹭到了摆放在转角处的一个艺术品展架,导致一件标价 8.8 万元的艺术瓷器摔碎。商场方目前态度强硬,拒绝任何调解,要求我按照标价全额赔偿。作为被告,我的抗辩点在于:展架位于人流量大的转角处,且没有任何物理防护(如玻璃罩);展架底座极轻,明显不符合摆放易碎重物的安全标准;我只是正常行走,并无跑跳等过激行为。请你作为我的专业辩护律师。

反应速度非常快,几个 Thinker 迅速从不同角度切入。

有的负责分析商场的过错,有的提到一些案例参考,还有的侧重风险评估和紧急措施。


它给出的一些答案,我怕是幻觉,还特地去核实了以下思维链中提到民法典1198条、1165条、1173条,也是正确的。


有点可惜的是重度思考暂时还没接入联网搜索,所以这块大家还是要谨慎,出的条款最好都去印证一下,毕竟思考模型普遍都会有幻觉,有出错的概率。把它当做辅助律师团即可。

最终回答:


不过对于我们普通人来说,遇到这种突发状况,能有这么一个智囊团,可以第一时间快速了解一些信息,心里真的会踏实很多。


中西结合的身心健康指导

有一些朋友和我聊起最近莫名不太好入睡,想起来下个月就过年了,

是丙午马年,丙火和午火双火叠加,六十年一遇,

部分朋友可能会有水火交战的情况,明明没有什么心烦的事情,却睡不着,赶紧来试试Longcat怎么说。

还有,我从小到大基本上午觉就没睡着过,可能是过度焦虑的原因?

很好玩的是,居然得到了中西结合的回答,还是那句话,集百家之所长,取其精华,去其糟粕,很好用。

如果是其他大模型,被我引导提问,就只会从中医的角度回答了。

下面豆包的回答,被我提问之后,只会从中医角度回答问题:


但 LongCat的 8 个Thinker 里,有的Thinker提供中医视角,有的提供现代医学视角,有的提供改善睡眠建议,真的是面面俱到,中西结合,完美!


以下是正文回答,有需要的朋友可以参考一下,也可以点赞转发,说不定你就有朋友也遇到了。



风格化写作,绝了

我让它用最强烈的文学风格描写一碗螺蛳粉,并且让它自己选择流派。

prompt:我现在手里端着一碗热腾腾的、闻起来臭吃起来香的螺蛳粉。 我希望看到风格极度强烈的文学描写。请选择一个你认为最有趣的文学流派(例如:鲁迅的冷峻讽刺、古龙的简洁萧杀、王家卫的暧昧破碎、张爱玲的华丽苍凉等等)。

8 位大作家开始吭哧吭哧写作。最后的评判环节非常有意思。有 5 位 Thinker 选择了张爱玲风格,2 位选了古龙,1 位选了王家卫。


按理说,少数服从多数,最后应该是张爱玲风格胜出。因为已经有5位部下都选了张爱玲风格,

毕竟作为领导,最轻松最不用担责的决策才是最经济的。

但那个负责总结的裁判模型展现出了惊人的批判性思维,它认为古龙那种简洁萧杀的风格,反而更能突出一碗螺蛳粉的江湖气,而且能避免答案的同质化。

最终输出的古龙风描写,文笔真的是一绝。


这也让我突然意识到,这种多模型并行思考加裁判决策的机制,可能真的代表了未来AI决策的一种新方向。


代码能力

Prompt:帮我设计一个猫猫狗狗挂饰网站的前端,要可爱风,写在一个HTML文件里

迅速完成了代码,购物车逻辑、结算功能都写了,交互体验也很流畅。

后来我又试着让它写一个大鱼吃小鱼的游戏。

它通过联网搜索参考了最佳实践,还自动给游戏里的鱼加上了 AI 判定,大鱼会追,小鱼会跑,可玩性瞬间提升了一个档次。

为什么美团这个模型值得关注?

美团这次的 Heavy Thinking Mode,本质上是在解决大模型思考深度不足的问题。

以前我们觉得大模型像个百科全书,问啥知道啥,但一遇到需要推理、规划的复杂问题就容易掉链子。

LongCat的思路是:既然一个脑子不够用,那就用八个。

通过并行推理(Parallel Thinking),先让思维发散出去,覆盖尽可能多的可能性;再通过迭代摘要(Iterative Summarization),把这些发散的思维收敛回来,提炼出最优解。

这就像我们在公司开会解决难题,先大家头脑风暴,各抒己见,这是广度。然后项目经理把大家的想法汇总、去重、优化,形成方案,这是深度。

而且美团在训练这个模型的时候,用了大量的合成环境和抗噪声训练,这意味着什么?

意味着这个模型不是温室里的花朵,它是真的被扔到那种充满了不确定性、信息不完整的真实环境里去摸爬滚打过的。

所以它在面对我们现实生活中那些乱七八糟的任务时,适应性会特别强。

美团虽然在这一波大模型浪潮里起步不算最早的,但他们追赶的速度真的让人惊讶。

上周末我们几个博主聊天还在感慨,像 Meta、微软这些巨头,有钱有卡,但在大模型上也逐渐没啥声音了。

这也侧面反映,做大模型这事儿,门槛真的很高,不是谁都能一直在牌桌上的。

美团能坚持下来,并且不断有这种高质量的产出,说明他们对 AI 是有自己独立的思考和战略定力的。

如果你也对AI Agent感兴趣,或者在开发相关的应用,可以去试试这个LongCat-Flash-Thinking-2601。

可能会给你带来一些意想不到的惊喜。

点击关注下方账号,你将感受到一个朋克的灵魂,且每篇文章都有惊喜。

能看到这里的都是凤毛麟角的存在!

如果觉得不错,随手点个赞、在看、转发三连吧~

如果想第一时间收到推送,也可以给我个星标⭐

谢谢你耐心看完我的文章~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“都腺样体了,还给他吃烤肠呢?”一份糊弄早餐暴露家长的低认知

“都腺样体了,还给他吃烤肠呢?”一份糊弄早餐暴露家长的低认知

妍妍教育日记
2026-01-13 16:27:54
果然不出所料,中国送欧洲一句“能救命”的话后,特朗普态度秒变

果然不出所料,中国送欧洲一句“能救命”的话后,特朗普态度秒变

知鉴明史
2026-01-22 18:25:22
李赛凤趁丈夫出差,和体格壮硕的干儿子发生了亲密接触

李赛凤趁丈夫出差,和体格壮硕的干儿子发生了亲密接触

西楼知趣杂谈
2026-01-20 17:11:19
人社部明确!2026养老金继续调整,1956年到1960年出生,涨更多吗

人社部明确!2026养老金继续调整,1956年到1960年出生,涨更多吗

有范又有料
2026-01-21 18:39:29
协议紧急叫停?普京万万没想到,中国正式断供俄电,俄痛失大单

协议紧急叫停?普京万万没想到,中国正式断供俄电,俄痛失大单

冒泡泡的鱼儿
2026-01-21 11:54:12
猝不及防?柯文哲突然翻脸,郑丽文霸气发声,蒋万安赢了!

猝不及防?柯文哲突然翻脸,郑丽文霸气发声,蒋万安赢了!

小正说娱乐
2026-01-22 14:04:39
宁夏回族自治区卫生健康委员会原党组书记、主任吕金捍被提起公诉

宁夏回族自治区卫生健康委员会原党组书记、主任吕金捍被提起公诉

界面新闻
2026-01-22 16:06:16
1换1!交易达成!你好,天才十号秀!

1换1!交易达成!你好,天才十号秀!

篮球实战宝典
2026-01-22 15:30:28
中方没有答应;特朗普通告全球:加税200%;美媒罕见站队中国

中方没有答应;特朗普通告全球:加税200%;美媒罕见站队中国

小叨娱乐
2026-01-22 13:56:51
16GB+1TB!新机官宣:1月22日,正式发布上市!

16GB+1TB!新机官宣:1月22日,正式发布上市!

科技堡垒
2026-01-22 11:06:21
19+8!名帅之女留洋爆发 多记干拔三分 能敲开国家队大门吗?

19+8!名帅之女留洋爆发 多记干拔三分 能敲开国家队大门吗?

你看球呢
2026-01-22 15:48:48
WTT常规赛:向鹏连输2局!挽救局点仍8-11惜败,卡尔伯格2-0冲8强

WTT常规赛:向鹏连输2局!挽救局点仍8-11惜败,卡尔伯格2-0冲8强

刘姚尧的文字城堡
2026-01-22 16:44:25
工信部下达“强制瘦身令”:不达标的新能源车,禁止“出道”

工信部下达“强制瘦身令”:不达标的新能源车,禁止“出道”

DearAuto
2026-01-21 09:52:46
从U20国青到U23,泰山双星拉开差距:彭啸、史松宸已不在一个段位

从U20国青到U23,泰山双星拉开差距:彭啸、史松宸已不在一个段位

球场没跑道
2026-01-22 12:01:20
官方:39岁前广东外援威姆斯加盟NBL新军焦作文旅

官方:39岁前广东外援威姆斯加盟NBL新军焦作文旅

懂球帝
2026-01-22 18:04:11
我出售南京的大平层搬进女儿家,女儿以为我睡熟了,跟女婿密谋

我出售南京的大平层搬进女儿家,女儿以为我睡熟了,跟女婿密谋

朝暮书屋
2026-01-21 17:26:45
广东名记质疑CBA裁判:广东队做不行,为何其他球队做就可以

广东名记质疑CBA裁判:广东队做不行,为何其他球队做就可以

体育哲人
2026-01-22 17:56:05
山西省人民政府关于白杰飞等9人任免职务的通知

山西省人民政府关于白杰飞等9人任免职务的通知

锦绣太原
2026-01-22 09:46:35
嘲笑川普的人该补历史课:美国购买格陵兰是150年的国家战略

嘲笑川普的人该补历史课:美国购买格陵兰是150年的国家战略

斌闻天下
2026-01-22 06:20:03
北京首辆加长劳斯莱斯银刺,车里带电话,开库里南的都羡慕

北京首辆加长劳斯莱斯银刺,车里带电话,开库里南的都羡慕

华庭讲美食
2026-01-22 12:10:42
2026-01-22 19:39:00
袋鼠帝 incentive-icons
袋鼠帝
持续分享AI实践干货,走超级个体崛起之路
31文章数 16关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

头条要闻

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

潘功胜:继续实施好适度宽松的货币政策

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

房产
手机
游戏
公开课
军事航空

房产要闻

开年王炸!四重政策红利加码,广州置业窗口期迈入倒计时!

手机要闻

真我realme手机今年4月全面接入OPPO售后服务

LPL春季赛:为了厂长,为了国电!EDG横扫TT

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京:愿意向"和平委员会"提供10亿美元

无障碍浏览 进入关怀版