几小时前,中国头部即时配送科技企业美团正式在GitHub、Hugging Face及自有原生平台上发布新一代万亿参数大模型LongCat-2.0,首次向全球公开了此前在OpenRouter上以匿名身份“Owl Alpha”运行的隐形爆款模型的真实身份。过去两个月里,这个未披露主体的匿名模型一路攀升,稳居全球开发者调用排行榜前列,如今随着美团的正式官宣,这款1.6万亿参数的近前沿代理编码模型的完整技术图景终于向公众揭开。
![]()
1.行业里程碑:完全基于国产芯片训练的万亿参数模型
让此次发布成为全球科技基础设施决定性转折点的核心特质,是其完全自主的运营独立性:LongCat-2.0的全流程训练与推理,全部在超过5万台中国国产专用集成电路(ASIC)组成的算力集群上完成,全程未依赖英伟达GPU,首次向行业证明,近前沿级别的万亿参数AI模型完全可以不依托传统美国通用GPU生态实现稳定扩展。
这一替代硅路线的成功落地,标志着全球AI产业格局正在发生深刻的结构性转变。长期以来,英伟达凭借其在AI训练芯片领域的垄断地位,占据了全球90%以上的训练市场份额,而美团此次用全国产算力完成万亿模型的全流程落地,意味着如果中国科技企业能够持续迭代万亿参数架构,完全依托自研ASIC而非海外通用GPU推进技术演进,将直接撼动英伟达在全球AI算力领域的长期主导地位。
![]()
这一技术转向的时间节点恰好与美国的技术限制政策形成了微妙的呼应:近期华盛顿持续施压美国顶级AI实验室限制其最新型号的对外访问,OpenAI已被迫限制新发布的GPT-5.6模型的访问权限,Anthropic此前也被要求限制最新Claude Fable 5 / Mythos 5型号的访问,最终导致相关服务完全下线。越来越多的行业专家指出,这类防御性的监管操作正在产生完全相反的效果——西方闭源模型的访问被封锁、API成本持续高企,反而为全球开发者留出了广阔的窗口期,大量开发者开始转向寻找类似美团LongCat-2.0这样高性价比的高性能开源替代方案。
来自OpenRouter的原始运营数据充分印证了全球开发者的热情:在匿名部署阶段,Owl Alpha的月处理代币量达到10.1万亿,日均处理5590亿代币,月环比增速高达242%,总调用量直接跻身全球前三。美团正式官宣时,该模型已经在Hermes代理工作场景拿下全球第一,在Claude Code部署场景位列全球第二,在OpenClaw国际环境中位列全球第三,成为全球开发者最受欢迎的免费高性能模型之一。
2.技术架构:面向1M令牌稀疏环境的深度工程优化
LongCat-2.0的核心设计围绕专家混合(MoE)架构的稀疏性展开,总参数规模达到1.6万亿,同时将单令牌平均激活参数控制在480亿,根据查询的结构复杂度,动态激活参数的区间可在330亿到560亿之间灵活调整。
模型搭载了业界首创的“零计算专家”框架,让常规执行元素通过更轻量的子网络完成处理,彻底消除了超密集模型普遍存在的闲置计算开销。为了在不触发硬件瓶颈的前提下实现原生100万令牌上下文窗口,美团自研了LongCat稀疏注意力(LSA)机制,作为DeepSeek稀疏注意力的进化迭代版本,通过三大正交设计解决了细粒度稀疏机制中常见的二次评分成本与内存碎片化问题:
·流媒体感知索引(SI):将硬件对齐的连续数据读取与动态随机选择相结合,重构令牌选择流水线,把碎片化的内存访问转化为高度可预测的顺序块,大幅提升高带宽内存(HBM)利用率与有效带宽。
·跨层索引(CLI):利用注意力显著性在相邻隐藏层间高度稳定的特性,单次索引即可引导多个连续层的推断,相关能力在全训练阶段通过跨层蒸馏得到持续强化,大幅摊销了计算成本。
·层级索引(HI):采用从粗到细的两阶段计分布局,索引器先通过快速近似的区块级回忆过滤候选对象,再对剩余内容执行细粒度的令牌选择,兼顾效率与精度。
除此之外,美团还在模型中集成了继承自其轻量模型线的N-gram嵌入模块,在完全垂直于MoE专家布局的稀疏维度中扩展参数分配,为5克令牌组合框架附加了1350亿参数,让核心嵌入空间规模提升约100倍,既可以捕捉密集的局部令牌关系,也能通过降低内存输入/输出(I/O)瓶颈,大幅加快大批量推理操作的速度。
3.产品定位:聚焦代理任务的专项优化与基准表现
不同于通用大模型优先优化对话流畅度的思路,LongCat-2.0从设计之初就明确聚焦多步工程任务、工具集成与自动化运维操作,也就是面向代理场景打造的专项模型。
在标准化评测中,LongCat-2.0在SWE-bench Pro上拿到了59.5分,超越了GPT-5.5的58.6分基准;在Terminal-Bench 2.1测试中得分70.8,SWE多语言测试得分77.3,通用企业工作流程模拟器FORTE测试得分73.2,在编码与代理相关的专项评测中达到了全球顶尖水平。
这样精准的操作能力,来自于名为多教师优化(MOPD)的结构化训练后层:不同于将人类反馈融合为单一奖励函数的传统方案,MOPD架构将训练后优化拆分为3个独立且高度聚焦的专家集群:
Agent Experts专注于结构执行,打磨精准工具调用、多回合API参数解析与自我纠正循环机制,避免执行过程停滞;
推理专家在独立阶段完成优化,重点提升多跳逻辑、复杂思维链工程、数学与高级STEM问题解决能力;
互动专家则完全聚焦人机协同、指令遵循细节、事实基础以抑制幻觉,在不削弱模型实用性的前提下维持严格的安全防护。
通过在训练后阶段分离不同能力载体,LongCat-2.0有效避免了多能力融合带来的功能退化问题,运行时通过动态门路由机制无缝融合各类专用行为,让模型可以同时兼顾深度推理、稳定工具执行与安全用户交互。
整体来看,LongCat-2.0在FORTE、BrowseComp等通用代理基准上略落后于Claude Opus 4.8等顶级前沿闭源系统,但在软件工程专项能力上明显超越同级别产品,尤其在SWE-bench Pro这样的硬核软件工程基准上以微弱优势超越OpenAI的GPT-5.5,证明了在更精简的计算量下,开源架构依然可以在复杂编码任务中拥有极强的竞争力。
4.商业框架:高性价比的计费模式重构代理开发成本
美团为LongCat-2.0设计了极具冲击力的商业化定价体系,推出了“按用量付费”的标准API模式,同时搭配限时“令牌包”闪售范式,最具颠覆性的是所有上下文缓存命中的内容全部免费处理。
标准定价下,非缓存访问的输入代币价格为每百万0.75美元,输出代币为每百万2.95美元。而限时促销折扣进一步大幅压低了运营成本,促销期内未缓存输入代币仅需每百万0.30美元,输出代币每百万1.20美元,直接进入全球高性能模型的低价区间。
除了传统的实时按用量付费模式,美团还推出了适配代理开发场景的“令牌包”机制:用户可以一次性购买固定额度的代币包,有效期为30天,直接叠加在现有API账户之上。为了平衡国产ASIC集群的网络负载,美团会在北京时间每天10:00、16:00、21:00、23:00四个时段开启限量闪售,先到先得。
而上下文缓存完全免费的设计,彻底重构了大规模代理软件开发的成本逻辑:在传统架构中,编码助手在长会话中反复读取、引用、修改同一数百万令牌的代码库时,重复输入的上下文会被全额计费,大幅推高开发成本。而在LongCat-2.0的体系下,只有缓存未命中的输入和最终生成的代币才会消耗配额,让深度迭代的长上下文探索无需承担复利式的成本增长。
5.开源许可:MIT协议赋予企业级最大自由度
美团选择以MIT开源协议发布LongCat-2.0的全部仓库内容,为企业集成提供了最高级别的法律灵活性。
不同于GPL等强Copyleft协议要求衍生作品也必须开源的约束,MIT协议几乎没有使用限制,企业工程团队可以深度修改模型代码、优化内部LSA机制适配私有数据库,将最终的软件栈编译并硬编码到闭源商业应用、专有开发工具与内部自动化后端中,完全无需披露相关的专有知识产权与结构增强内容,最大程度降低了企业落地的法律风险。
美团由王兴于2010年创立,最初以类似Groupon的每日优惠网站起步,逐步成长为中国头部的“超级应用”平台,在2015年完成大规模行业合并后,巩固了城市即时配送领域的主导市场份额,业务覆盖本地消费评价、即时零售、酒店预订与外卖配送,作为港交所上市企业,拥有超过7.7亿年交易用户,服务超过1450万线下商户。
6.美团的战略转向:从配送超级应用到全球AI基础设施基石
面对国内市场的激烈竞争与利润率压力,美团启动了从物流科技向AI科技的战略转型,公开承诺投入数十亿美元布局人工智能与国产算力能力。这场向全球AI赛道的进军从2025年底就已经启动,美团先后发布了5600亿参数的LongCat-Flash基础MoE模型,以及后续的LongCat-Flash-Thinking高级推理模型,通过企业友好的开源许可逐步释放前沿级模型能力,清晰传递出从区域电商配送巨头,成长为全球AI基础设施核心支柱的雄心。
对于现代企业而言,LongCat-2.0的发布带来了明确的运营升级路径:开放权重的MIT授权模型搭配100万令牌原生上下文窗口,让组织可以绕过第三方闭源API的数据限制,在大规模企业开发环境中自主掌控软件工程、系统运维与长数据解读的全流程工作流,打造完全自主可控的AI生产力体系。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.