网易首页 > 网易号 > 正文 申请入驻

央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎

0
分享至

允中 发自 凹非寺
量子位 | 公众号 QbitAI

7月26日,在世界人工智能大会(WAIC)上,中国移动正式发布了MoMA多模型与智能体聚合及服务引擎

MoMA引擎通过汇聚业界多种优质模型与智能体,能够根据应用场景,自动匹配及调用最优专家模型和专用智能体,形成超级大模型能力服务基座,为解决复杂任务提供更为强大的解决方案。

01.当前主要的问题与挑战

目前,国内外已发布多款模型,每个模型在不同时间段内在某些应用场景表现出卓越的能力,例如代码编写、写作、数学、翻译等。

未来将是多种模型共存的局面,HuggingFace已有数百万个这些模型的微调变体。因此,企业在应用这些模型时面临如下挑战:

  • 一是调度与组合难题:如何选择不同能力和接口各异智能体、模型进行有效的组合解决具体问题;
  • 二是意图理解与规划挑战:用户指令语义丰富且目标模糊,要求智能体具备更强的意图探测能力,以规划更优执行路径。
  • 三是成本收益平衡:如何平衡效率、效果和成本三者关系,达到提速降本的目标。

MoMA通过多级路由技术,主要解决了模型的路由选择和能力规划调度的基础问题,为企业及个人用户解决上述痛点与挑战提供了具体方案。

02.MoMA是什么?

九天MoMA(Mixture of Models and Agents)即多模型与智能体聚合及服务引擎,通过标准化接口广泛汇聚业界优质大模型与专用智能体,面向复杂行业场景提供“场景-模型-智能体”的自动感知、动态编排与最优调用能力,形成具备持续进化特性的超级大模型服务基座,提供高准确率、高安全、高可靠、高效能的大模型推理服务。

MoMA核心主要包括三部分:

MoMA模型

MoMA根据对模型能力的探测和智能体能力的评估,以及对用户意图的理解和识别,明确不同组合下的协同优势与潜在冲突;根据对用户输入的分析,判断模型和智能体的依赖关系及其能力范围,自动选择最佳方案。

同时,通过闭环监控反馈机制,构建“实时感知-动态调整-持续验证”的循环链路,以更好地适应数据变化、业务需求和环境波动。

模型能力洞察及构建主要通过对模型和智能体能力的深入探测,从成本、效果和难易程度等方面构建其能力高维表征,实现用户需求与智能体路由的快速匹配;通过评分机制,评估不同模型和智能体的效果,便于分层路由模型进行快速任务分发。

通过原创性地提出“问题难度-领域矩阵”(Problem-difficulty vs. Domain Matrix, PD²-Matrix)的大语言模型(LLM)系统性框架,核心目标是通过标准化分类与评估,全面揭示模型在不同任务场景下的表现边界,以及不同模型在相同领域问题上的排名情况。

该框架将任务按照问题复杂度与知识领域两个正交维度进行系统化分类,并在每个矩阵单元设计差异化的评估指标。其核心创新在于将大语言模型的“黑箱”能力转化为结构化的“能力矩阵”,通过正交维度分类、探测工具和可视化分析,实现了从“笼统评估”到“精准诊断”的跨越。

在PD²-Matrix框架下,采用Pareto优化拟合给定任务分布上 T的模型得分(效果)S(T)与成本C的得分–成本(S-C)曲线,实现了效果和成本之间的动态权衡和调整。

通过上述流程,不仅在 PD²-Matrix 框架下实现了对性能-成本关系的可解释建模,还能以任务分布T为条件,为不同下游应用提供个性化的资源-性能权衡策略,最终达到“用最小的成本获得所需的性能”这一核心目标。

MoMA工程引擎

以分层路由与动态编排为核心,通过标准的协议连接模型、智能体、工具,形成超级大模型能力基座,实现对任务类型、资源分配、执行流程的动态管理,在效果、成本、效率三重约束下完成最优决策,提速降本。

  • 多级路由机制及动态洞察

在分层路由模型机制中,多级路由各司其职,分层次完成复杂任务的拆解与实现。其中一级路由完成专家模型、简单任务、复杂任务的分发;二级路由在综合准确度和成本的条件下,根据复杂度把问题分发到具备不同参数规模或者是专长的专家模型予以响应;采用Monitor Model对推理内容进行实时监控、复盘两级路由模型的分发质量,同时丰富标注数据集动态优化路由模型。

  • 复杂任务去中心化

对于用户多意图及复杂任务,MoMA工程引擎采用了Planner-Executor-Summarizer架构,能够根据具体任务动态地采用ReAct、Route、Parallelize、Swarm等混合模式,实现任务的自动拆解、编排与并行调用。

传统AI系统通常采用固定模式回答问题,规划执行的步骤越多,所需的计算资源也越多,在某些任务中,AI可能在无需人工干预的情况下执行数十个步骤。通过采用复杂任务路由技术,将请求发送给专门的规划模型,选择不同的执行模式或混合模式,将用户的意图分配至合适的智能体或大模型,并通过监控推理输出内容,进行动态接管与调整,从而保证回答的效果和效率。

此外,这种方式还避免了或减少了依赖中心规划模型对智能体或工具输出内容的重复推理评估,降低了输出幻觉,提升了整体响应时间,全面优化了用户体验。

MoMA协议体系

目前针对模型与外部工具、数据源之间,智能体与智能体之间的协同问题,业界已有部分协议尝试对其进行规范化。主流协议包括Anthropic公司提出的MCP(Model Context Protocol,模型上下文协议)和Google提出的A2A(Agent2Agent)。

其中MCP是一种用于规范模型或智能体与外部数据源、工具和服务之间的交互的开放协议,其通过结构化的输入/输出将模型或智能体与工具、API和资源连接起来,可以将其视为模型或智能体扩展自身能力的标准方式。

A2A协议则是一种用于智能体之间通信与互操作性的开放标准,其为由不同框架、不同语言或不同厂商构建的智能体提供了一套通用的语言与交互接口。原生的MCP协议没有对模型和工具之间交互的安全性进行限制,同时工具对模型的可调度性也缺少规约。

MoMA在兼容业界规范的基础上拓展统一认证、安全通信等能力,对工具的可调度性进行了增强,在此基础上构建了中国移动特色的A2A,MCP协议,实现对业界智能体生态的兼容,形成开放、安全、可信、高效的中国移动智能体技术体系的服务底座。

03.MoMA应用

MoMA聚合包括九天大模型、Qwen和DeepSeek等15+个高质量内外部模型,涵盖通用模型和专业模型,涉及编程、数学、翻译、医疗等多个领域,并接入了20多个专家智能体,例如日常管理、会议助手、咪咕音乐和深度报告等,帮助用户迅速解决专业领域的问题,精准匹配用户需求。

在覆盖百万级用户的情况下,MoMA的动态路由机制在不同参数模型(1B、3B、8B、75B、200B)之间灵活切换,整体速度相比固定的75B参数模型提升了42%。

目前,MoMA已应用于中国移动的灵犀智能体2.0,助力灵犀智能体全面升级为跨领域、多任务、自规划的通用型智能体,为用户在“通信、生活、出行、办公、家庭”等多元化场景中提供特色服务。

04. 商业化落地愿景

中国移动在新技术研发的道路上一直持续深耕并获得广泛认可,MoMA聚合引擎的发布提供了中国移动与各产业合作的新范式。

随着更多行业实践的深入,中国移动将持续释放生产力价值,致力于为开发者及大模型企业提供人工智能快速解决方案,在技术创新、产品迭代与生态建设方面,持续前进,为广大用户提供更好的产品与服务,带动产业与技术的创新与规模化发展。

通过MoMA多模型与智能体聚合及服务引擎,中国移动将依托充沛的算力资源,实现业界优质大模型及智能体的汇聚及灵活调度,构建起百模互联、千智协同的全新产业协同生态,打造AI能力聚合和普惠服务的全新智能服务范式,将驱动中国人工智能产业迈入发展新阶段。

为方便产业合作伙伴了解MoMA并参与其生态共建,九天人工智能研究院发布了《多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)》。白皮书介绍了MoMA的目标愿景和总体框架、关键技术特征、典型应用场景和未来展望与倡议,可扫码获取白皮书原文。

8月6日开始,九天将开展一系列技术直播,重点解析九天基础大模型、开源模型及数据集,锁定“九天人工智能”视频号,获取最新技术干货。

*本文系量子位获授权刊载,观点仅为原作者所有。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
解放军强势回应!视频曝光:战机集结进驻菲美日澳巡航区域

解放军强势回应!视频曝光:战机集结进驻菲美日澳巡航区域

健身狂人
2026-03-02 00:53:05
美军瞒不住了!炸航母基地,炸11亿美元雷达,几十万吨燃油被点燃

美军瞒不住了!炸航母基地,炸11亿美元雷达,几十万吨燃油被点燃

健身狂人
2026-03-01 18:17:15
缺阵一个月,还不打算复出!年薪5960万联盟第一,你确实该表态了

缺阵一个月,还不打算复出!年薪5960万联盟第一,你确实该表态了

老梁体育漫谈
2026-03-02 00:08:31
苦等多年,中国最强地级市,终于要建机场了

苦等多年,中国最强地级市,终于要建机场了

快刀财经
2026-03-01 22:15:01
真正生理性的喜欢,根本藏不住!不是接吻和拥抱,而是……

真正生理性的喜欢,根本藏不住!不是接吻和拥抱,而是……

青苹果sht
2026-02-22 06:58:00
特朗普怎么都没想到:哈梅内伊死前做的最后一项安排,会如此厉害

特朗普怎么都没想到:哈梅内伊死前做的最后一项安排,会如此厉害

生活魔术专家
2026-03-02 01:11:30
黄景瑜领衔,李雪健 倪大红坐镇!38集犯罪大剧来袭!要引爆收视

黄景瑜领衔,李雪健 倪大红坐镇!38集犯罪大剧来袭!要引爆收视

小椰的奶奶
2026-03-01 20:45:38
特朗普:对伊朗的不间断打击将持续一周甚至更长时间

特朗普:对伊朗的不间断打击将持续一周甚至更长时间

环球网资讯
2026-03-01 06:22:06
人在家中坐,祸从天上来!58岁演员王劲松,终是步入了靳东的后尘

人在家中坐,祸从天上来!58岁演员王劲松,终是步入了靳东的后尘

手工制作阿歼
2026-03-02 00:36:32
最新!以军发动大规模空袭

最新!以军发动大规模空袭

环球时报国际
2026-03-01 18:13:27
湖人狂胜勇士,艾顿仅得4分10篮板,遭奥尼尔和巴克利群嘲!

湖人狂胜勇士,艾顿仅得4分10篮板,遭奥尼尔和巴克利群嘲!

爱体育
2026-03-01 23:57:13
美以突袭伊朗引发避险情绪,国内金饰价格集体突破1600元,专家:黄金已叠加了过多的地缘风险溢价

美以突袭伊朗引发避险情绪,国内金饰价格集体突破1600元,专家:黄金已叠加了过多的地缘风险溢价

极目新闻
2026-03-01 17:37:18
网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

快科技
2026-02-27 21:58:15
如果中国美国开起战争,第二天全世界就发现,美国不再是超级大国

如果中国美国开起战争,第二天全世界就发现,美国不再是超级大国

徐醇老表哥
2026-01-27 16:26:32
1985年,19岁的苏菲·玛索在东京街头,英气十足

1985年,19岁的苏菲·玛索在东京街头,英气十足

娱你同欢
2026-02-15 10:12:04
这是目前为止,我见过腰最细的女生,没有之一

这是目前为止,我见过腰最细的女生,没有之一

喜欢历史的阿繁
2026-03-02 01:00:23
荷兰半导体专家:ASML花费40年钻研光刻机,中国企业竟比ASML还狠

荷兰半导体专家:ASML花费40年钻研光刻机,中国企业竟比ASML还狠

策略述
2026-02-28 17:11:40
俄媒突发警告:美国打伊朗只是幌子,目的是逼解放军到太平洋决战

俄媒突发警告:美国打伊朗只是幌子,目的是逼解放军到太平洋决战

刚哥说法365
2026-02-28 21:07:26
奥园集团破产审查

奥园集团破产审查

地产微资讯
2026-03-01 19:52:57
伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

眼光很亮
2026-03-01 16:43:04
2026-03-02 03:36:49
量子位 incentive-icons
量子位
追踪人工智能动态
12211文章数 176399关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

艺术
家居
房产
游戏
军事航空

艺术要闻

看!这位伊朗超模如何颠覆你的美丽认知!

家居要闻

素色肌理 品意式格调

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

以《生化危机》命名?Capcom解答对RE引擎的误读

军事要闻

伊朗前总统内贾德遇袭身亡

无障碍浏览 进入关怀版