网易首页 > 网易号 > 正文 申请入驻

业界首个:美团LongCat-2.0发布,国产芯片上跑出的万亿参数模型

0
分享至

IT之家 6 月 30 日消息,美团今日发布新一代万亿参数大模型LongCat-2.0,并将对外开源。

LongCat-2.0 宣称是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型(总参数 1.6 T,平均激活约 48 B,动态范围 33B~56B),从零开始预训练,原生支持 1M 超长上下文

正式版发布前,LongCat-2.0 预览版本已通过 OpenRouter 平台和 longcat.ai 面向全球开发者开放调用 ——截至目前该模型已跻身 OpenRouter 全球大模型调用量前三,月调用量在 Hermes、Claude Code 和 OpenClaw 分列全球第一、第二和第三位。

LongCat-2.0 预训练数据规模超过 30T tokens,覆盖中文、英文、多语言和代码等多类数据;面对万卡级训练中的硬件故障、通信异常、显存压力与数值波动,LongCat 团队从稳定性、正确性和效率三方面攻克国产算力训练难题。

  • 稳定性上,通过 HCCL 异常处理、弹性扩缩卡和自动故障恢复,将月均日故障率降低 70% 以上;
  • 正确性上,通过自研设计确定性算子、Bitwise 一致性验证和参数检测,保障训练结果的可靠,同时基于实践提升关键模块计算精度、优化 Reduce 逻辑;
  • 效率上,通过流水线调度、显存优化和算子级控核,训练 MFU 提升 1.5 倍。

最终,LongCat 实现稳态日吞吐超过 1T tokens / day,完成万亿参数 MoE 模型在国产算力上的稳定训练。

在推理阶段,LongCat-2.0 围绕模型、算子和框架进行协同优化:

  • 通过大规模专家并行聚合访存带宽,支撑万亿参数 MoE 模型的低延迟解码;
  • 将零计算专家机制融入专家并行通信流程,使路由到零专家的 token 真正避免不必要的传输与计算;
  • 针对通信、Attention、GEMM 等核心算子优化调度,结合提前下发与权重预取等框架机制,进一步降低推理链路中的等待开销。

LongCat-2.0 采用 LongCat Sparse Attention(LSA)稀疏注意力机制,在处理长文本时不再“逐字逐句地看”,而是智能筛选关键信息,将计算量从平方级降至线性级。这使得模型在 100 万 Token 的超长上下文中,依然保持信息定位与理解能力。

代码任务中不同 token 复杂度差异巨大 —— 定义变量名和推导递归算法对算力的需求完全不同。LongCat-2.0 通过零计算专家实现 token 级动态激活(33B~56B),简单 token 不消耗算力,复杂 token 自动获得更多计算资源

LongCat-2.0 通过 MOPD 架构融合 Agent、Reasoning、Interaction 三组专家能力 ——Agent Experts 专攻工具调用与自主纠错,Reasoning Experts 深耕数学与 STEM 推理,Interaction Experts 优化指令遵循与交互体验。推理时由门控网络根据任务类型动态调度最擅长的专家,而非简单合并参数。得益于此,模型在编程、推理、交互等维度均表现突出。


综合评测结果显示,LongCat-2.0 在 Code 和 General Agent 场景表现优异。


  • 在编程能力方面,LongCat-2.0 在考察深层工程能力的 SWE-bench Pro 中获得 59.5,领先 Gemini 3.1 Pro(54.2)、 GPT-5.5(58.6)和 Claude Opus 4.6(57.3);在 SWE-bench Multilingual 中取得 77.3 的成绩,与 Claude Opus 4.6(77.8)保持在同一水位;此外,在真实终端指令交互评测 Terminal-Bench 2.1 中取得 70.8,体现了其在真实运维与开发终端任务中的稳定执行与纠错能力。
  • 在真实办公场景的复杂任务处理方面,LongCat-2.0 在搜索智能体评测集 RWSearch 中获得 78.8,在生产力场景评测集 FORTE 中获得 73.2 ,在 BrowseComp 中获得 79.9,均达到或接近前沿闭源模型水平,能够较好的契合企业级 Agent 的落地需求。


IT之家附 API 开放平台地址如下:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
随着德国4-5巴拉圭,世界杯16强已出3席,欧洲0队,巴西绝杀日本

随着德国4-5巴拉圭,世界杯16强已出3席,欧洲0队,巴西绝杀日本

侃球熊弟
2026-06-30 07:30:21
世界杯:荷兰点球3-4无缘16强!创队史最差战绩 摩洛哥踢加拿大

世界杯:荷兰点球3-4无缘16强!创队史最差战绩 摩洛哥踢加拿大

念洲
2026-06-30 11:55:27
日本出局不可怕,可怕的是赛后森保一的宣言!黄健翔直接点破事实

日本出局不可怕,可怕的是赛后森保一的宣言!黄健翔直接点破事实

十点街球体育
2026-06-30 07:08:13
警方通报:40岁杨某诋毁袁隆平科研成果,被刑拘

警方通报:40岁杨某诋毁袁隆平科研成果,被刑拘

观察者网
2026-06-29 21:36:08
谈成了,白俄罗斯答应中国

谈成了,白俄罗斯答应中国

安安说
2026-06-30 10:31:41
瓜迪奥拉致德国三届世界杯止步,传控战术毁铁血战车

瓜迪奥拉致德国三届世界杯止步,传控战术毁铁血战车

老牛体育解说
2026-06-30 09:17:14
日本球迷挑衅!巴西网友回击:向全世界科普日本二战罪行+731恶行

日本球迷挑衅!巴西网友回击:向全世界科普日本二战罪行+731恶行

念洲
2026-06-29 20:03:58
为何能逆转日本?安切洛蒂一句话救了巴西 无愧老江湖 尽显冠军相

为何能逆转日本?安切洛蒂一句话救了巴西 无愧老江湖 尽显冠军相

萌兰聊个球
2026-06-30 07:42:05
魏敏芝现状:在美国当导演,全家定居夏威夷,如今40岁胖到不敢认

魏敏芝现状:在美国当导演,全家定居夏威夷,如今40岁胖到不敢认

白面书誏
2026-06-29 21:16:24
勇士奇才谈判巴特勒换浓眉!开启组建四巨头:老詹最多2300万年薪

勇士奇才谈判巴特勒换浓眉!开启组建四巨头:老詹最多2300万年薪

罗说NBA
2026-06-30 07:04:20
59岁克洛普怒了:德国绝杀若无效 阿森纳该剥夺冠军+6成进球吹掉

59岁克洛普怒了:德国绝杀若无效 阿森纳该剥夺冠军+6成进球吹掉

我爱英超
2026-06-30 08:54:39
开拓者官方欢迎莫兰特!2换1交易正式完成 杨瀚森利拉德迎新队友

开拓者官方欢迎莫兰特!2换1交易正式完成 杨瀚森利拉德迎新队友

罗说NBA
2026-06-30 09:12:32
电影《四渡》现飞夺卢沟桥?网友:别让这帮高考200分的人拍电影

电影《四渡》现飞夺卢沟桥?网友:别让这帮高考200分的人拍电影

蜜桔娱乐
2026-06-29 11:00:25
人民日报披露案情,抓捕12人,坐实《四渡》被黑

人民日报披露案情,抓捕12人,坐实《四渡》被黑

光影新天地
2026-06-29 20:00:56
12岁男生放学回家后坠亡,此前曾因涉早恋问题被老师公开批评,家长起诉学校索赔92万

12岁男生放学回家后坠亡,此前曾因涉早恋问题被老师公开批评,家长起诉学校索赔92万

大风新闻
2026-06-29 21:07:07
四渡赤水打的是国民党,电影《四渡》居然要和日本IP作战……

四渡赤水打的是国民党,电影《四渡》居然要和日本IP作战……

影视口碑榜
2026-06-29 13:38:35
Papi酱名下公司均已注销

Papi酱名下公司均已注销

鲁中晨报
2026-06-29 14:35:03
受贿数额特别巨大,河北省政协原副主席姜德果被提起公诉

受贿数额特别巨大,河北省政协原副主席姜德果被提起公诉

界面新闻
2026-06-30 10:01:53
中方通告全球,新一轮对日反制开始,高市早苗意识到事情严重了

中方通告全球,新一轮对日反制开始,高市早苗意识到事情严重了

共工之锚
2026-06-30 00:10:13
Shams:灰熊将莫兰特交易至开拓者,换回格兰特和克里斯-穆雷

Shams:灰熊将莫兰特交易至开拓者,换回格兰特和克里斯-穆雷

懂球帝
2026-06-30 04:46:05
2026-06-30 12:27:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
352294文章数 607320关注度
往期回顾 全部

科技要闻

DeepSeek V4正式版要来 高峰期API价格翻倍

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

体育要闻

日本众将掩面痛哭 连续3届先破门却被逆转

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

家居
数码
本地
教育
亲子

家居要闻

传奇筑 日常诗

数码要闻

英伟达4600颗最强GPU登陆微软:单卡288GB显存+37TB统一内存池

本地新闻

贵州小城的新目标:举办“村超”世界杯!

教育要闻

5秒钟搞定一道中考几何题

亲子要闻

全力“迎战”暑期就医高峰 深儿医龙华院区开启“超能模式”

无障碍浏览 进入关怀版