网易首页 > 网易号 > 正文 申请入驻

央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎

0
分享至

允中 发自 凹非寺
量子位 | 公众号 QbitAI

7月26日,在世界人工智能大会(WAIC)上,中国移动正式发布了MoMA多模型与智能体聚合及服务引擎

MoMA引擎通过汇聚业界多种优质模型与智能体,能够根据应用场景,自动匹配及调用最优专家模型和专用智能体,形成超级大模型能力服务基座,为解决复杂任务提供更为强大的解决方案。



01.当前主要的问题与挑战

目前,国内外已发布多款模型,每个模型在不同时间段内在某些应用场景表现出卓越的能力,例如代码编写、写作、数学、翻译等。

未来将是多种模型共存的局面,HuggingFace已有数百万个这些模型的微调变体。因此,企业在应用这些模型时面临如下挑战:

  • 一是调度与组合难题:如何选择不同能力和接口各异智能体、模型进行有效的组合解决具体问题;
  • 二是意图理解与规划挑战:用户指令语义丰富且目标模糊,要求智能体具备更强的意图探测能力,以规划更优执行路径。
  • 三是成本收益平衡:如何平衡效率、效果和成本三者关系,达到提速降本的目标。

MoMA通过多级路由技术,主要解决了模型的路由选择和能力规划调度的基础问题,为企业及个人用户解决上述痛点与挑战提供了具体方案。

02.MoMA是什么?

九天MoMA(Mixture of Models and Agents)即多模型与智能体聚合及服务引擎,通过标准化接口广泛汇聚业界优质大模型与专用智能体,面向复杂行业场景提供“场景-模型-智能体”的自动感知、动态编排与最优调用能力,形成具备持续进化特性的超级大模型服务基座,提供高准确率、高安全、高可靠、高效能的大模型推理服务。

MoMA核心主要包括三部分:



MoMA模型

MoMA根据对模型能力的探测和智能体能力的评估,以及对用户意图的理解和识别,明确不同组合下的协同优势与潜在冲突;根据对用户输入的分析,判断模型和智能体的依赖关系及其能力范围,自动选择最佳方案。

同时,通过闭环监控反馈机制,构建“实时感知-动态调整-持续验证”的循环链路,以更好地适应数据变化、业务需求和环境波动。



模型能力洞察及构建主要通过对模型和智能体能力的深入探测,从成本、效果和难易程度等方面构建其能力高维表征,实现用户需求与智能体路由的快速匹配;通过评分机制,评估不同模型和智能体的效果,便于分层路由模型进行快速任务分发。

通过原创性地提出“问题难度-领域矩阵”(Problem-difficulty vs. Domain Matrix, PD²-Matrix)的大语言模型(LLM)系统性框架,核心目标是通过标准化分类与评估,全面揭示模型在不同任务场景下的表现边界,以及不同模型在相同领域问题上的排名情况。

该框架将任务按照问题复杂度与知识领域两个正交维度进行系统化分类,并在每个矩阵单元设计差异化的评估指标。其核心创新在于将大语言模型的“黑箱”能力转化为结构化的“能力矩阵”,通过正交维度分类、探测工具和可视化分析,实现了从“笼统评估”到“精准诊断”的跨越。

在PD²-Matrix框架下,采用Pareto优化拟合给定任务分布上 T的模型得分(效果)S(T)与成本C的得分–成本(S-C)曲线,实现了效果和成本之间的动态权衡和调整。



通过上述流程,不仅在 PD²-Matrix 框架下实现了对性能-成本关系的可解释建模,还能以任务分布T为条件,为不同下游应用提供个性化的资源-性能权衡策略,最终达到“用最小的成本获得所需的性能”这一核心目标。

MoMA工程引擎

以分层路由与动态编排为核心,通过标准的协议连接模型、智能体、工具,形成超级大模型能力基座,实现对任务类型、资源分配、执行流程的动态管理,在效果、成本、效率三重约束下完成最优决策,提速降本。



  • 多级路由机制及动态洞察

在分层路由模型机制中,多级路由各司其职,分层次完成复杂任务的拆解与实现。其中一级路由完成专家模型、简单任务、复杂任务的分发;二级路由在综合准确度和成本的条件下,根据复杂度把问题分发到具备不同参数规模或者是专长的专家模型予以响应;采用Monitor Model对推理内容进行实时监控、复盘两级路由模型的分发质量,同时丰富标注数据集动态优化路由模型。



  • 复杂任务去中心化

对于用户多意图及复杂任务,MoMA工程引擎采用了Planner-Executor-Summarizer架构,能够根据具体任务动态地采用ReAct、Route、Parallelize、Swarm等混合模式,实现任务的自动拆解、编排与并行调用。

传统AI系统通常采用固定模式回答问题,规划执行的步骤越多,所需的计算资源也越多,在某些任务中,AI可能在无需人工干预的情况下执行数十个步骤。通过采用复杂任务路由技术,将请求发送给专门的规划模型,选择不同的执行模式或混合模式,将用户的意图分配至合适的智能体或大模型,并通过监控推理输出内容,进行动态接管与调整,从而保证回答的效果和效率。

此外,这种方式还避免了或减少了依赖中心规划模型对智能体或工具输出内容的重复推理评估,降低了输出幻觉,提升了整体响应时间,全面优化了用户体验。

MoMA协议体系

目前针对模型与外部工具、数据源之间,智能体与智能体之间的协同问题,业界已有部分协议尝试对其进行规范化。主流协议包括Anthropic公司提出的MCP(Model Context Protocol,模型上下文协议)和Google提出的A2A(Agent2Agent)。

其中MCP是一种用于规范模型或智能体与外部数据源、工具和服务之间的交互的开放协议,其通过结构化的输入/输出将模型或智能体与工具、API和资源连接起来,可以将其视为模型或智能体扩展自身能力的标准方式。

A2A协议则是一种用于智能体之间通信与互操作性的开放标准,其为由不同框架、不同语言或不同厂商构建的智能体提供了一套通用的语言与交互接口。原生的MCP协议没有对模型和工具之间交互的安全性进行限制,同时工具对模型的可调度性也缺少规约。

MoMA在兼容业界规范的基础上拓展统一认证、安全通信等能力,对工具的可调度性进行了增强,在此基础上构建了中国移动特色的A2A,MCP协议,实现对业界智能体生态的兼容,形成开放、安全、可信、高效的中国移动智能体技术体系的服务底座。

03.MoMA应用

MoMA聚合包括九天大模型、Qwen和DeepSeek等15+个高质量内外部模型,涵盖通用模型和专业模型,涉及编程、数学、翻译、医疗等多个领域,并接入了20多个专家智能体,例如日常管理、会议助手、咪咕音乐和深度报告等,帮助用户迅速解决专业领域的问题,精准匹配用户需求。

在覆盖百万级用户的情况下,MoMA的动态路由机制在不同参数模型(1B、3B、8B、75B、200B)之间灵活切换,整体速度相比固定的75B参数模型提升了42%。

目前,MoMA已应用于中国移动的灵犀智能体2.0,助力灵犀智能体全面升级为跨领域、多任务、自规划的通用型智能体,为用户在“通信、生活、出行、办公、家庭”等多元化场景中提供特色服务。

04. 商业化落地愿景

中国移动在新技术研发的道路上一直持续深耕并获得广泛认可,MoMA聚合引擎的发布提供了中国移动与各产业合作的新范式。

随着更多行业实践的深入,中国移动将持续释放生产力价值,致力于为开发者及大模型企业提供人工智能快速解决方案,在技术创新、产品迭代与生态建设方面,持续前进,为广大用户提供更好的产品与服务,带动产业与技术的创新与规模化发展。

通过MoMA多模型与智能体聚合及服务引擎,中国移动将依托充沛的算力资源,实现业界优质大模型及智能体的汇聚及灵活调度,构建起百模互联、千智协同的全新产业协同生态,打造AI能力聚合和普惠服务的全新智能服务范式,将驱动中国人工智能产业迈入发展新阶段。

为方便产业合作伙伴了解MoMA并参与其生态共建,九天人工智能研究院发布了《多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)》。白皮书介绍了MoMA的目标愿景和总体框架、关键技术特征、典型应用场景和未来展望与倡议,可扫码获取白皮书原文。

8月6日开始,九天将开展一系列技术直播,重点解析九天基础大模型、开源模型及数据集,锁定“九天人工智能”视频号,获取最新技术干货。

*本文系量子位获授权刊载,观点仅为原作者所有。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场同学聚会换来的惨痛教训:人过了60岁,还是别聚会了

一场同学聚会换来的惨痛教训:人过了60岁,还是别聚会了

蝉吟槐蕊
2025-11-09 09:58:48
演员于适任中国骑射运动中心执行主任,曾在《封神三部曲》饰演姬发

演员于适任中国骑射运动中心执行主任,曾在《封神三部曲》饰演姬发

澎湃新闻
2025-11-09 16:58:35
49岁赵薇近况再曝,胃癌传闻真相大白,善恶终有报

49岁赵薇近况再曝,胃癌传闻真相大白,善恶终有报

一娱三分地
2025-11-07 18:40:38
事出反常,东大为什么忽然沉默了?

事出反常,东大为什么忽然沉默了?

每日一见
2025-11-09 12:33:19
“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄 丨封面头条

封面新闻
2025-11-09 18:45:20
俄媒:俄军即将攻占乌克兰“第三首都”!俄副总理自曝参战:用狙击步枪还击乌军!俄对乌发动大规模空袭

俄媒:俄军即将攻占乌克兰“第三首都”!俄副总理自曝参战:用狙击步枪还击乌军!俄对乌发动大规模空袭

每日经济新闻
2025-11-08 22:55:11
学生偷东西被抓后续:小偷没事,被偷的反退学,更多恶心细节曝光

学生偷东西被抓后续:小偷没事,被偷的反退学,更多恶心细节曝光

奇思妙想草叶君
2025-11-08 21:13:10
赵本山抢救无效!?

赵本山抢救无效!?

八卦疯叔
2025-11-09 10:43:20
陕西一小伙结婚当天驾自制“飞机”成功飞天?村民称是他朋友来助兴,飞机5年前就首飞过,民航空管局回应

陕西一小伙结婚当天驾自制“飞机”成功飞天?村民称是他朋友来助兴,飞机5年前就首飞过,民航空管局回应

极目新闻
2025-11-08 23:56:08
碧桂园彻底暴雷!裁掉8万人、负债8000亿,碧桂园还想着翻身!

碧桂园彻底暴雷!裁掉8万人、负债8000亿,碧桂园还想着翻身!

历史伟人录
2025-11-08 16:12:29
博主称甘肃临夏有货车私自向大夏河中排放粉紫色不明液体,经检测为含高锰酸钾的运鱼水,环保部门回应

博主称甘肃临夏有货车私自向大夏河中排放粉紫色不明液体,经检测为含高锰酸钾的运鱼水,环保部门回应

极目新闻
2025-11-09 14:57:41
俄大规模袭击乌克兰,乌国有火电站陷入瘫痪,德军司令:若与俄开战,德将成北约集结地

俄大规模袭击乌克兰,乌国有火电站陷入瘫痪,德军司令:若与俄开战,德将成北约集结地

扬子晚报
2025-11-09 15:18:17
太惨了!烟台渣土车压扁宝马车,死亡司机身份曝光,是年轻女教师

太惨了!烟台渣土车压扁宝马车,死亡司机身份曝光,是年轻女教师

火山诗话
2025-11-09 16:09:29
钓鱼岛究竟有多大?上面能住人吗?终于揭开钓鱼岛神秘的面纱

钓鱼岛究竟有多大?上面能住人吗?终于揭开钓鱼岛神秘的面纱

缘史记
2025-11-07 18:14:40
江苏:34岁女子独自住院,没人照顾,流泪哭诉:熬不住了想结婚

江苏:34岁女子独自住院,没人照顾,流泪哭诉:熬不住了想结婚

阿芒娱乐说
2025-11-09 07:03:22
台风“凤凰”或登陆我国,外围环流将影响江苏

台风“凤凰”或登陆我国,外围环流将影响江苏

扬子晚报
2025-11-09 20:06:27
DNA之父沃森去世。天才科学家歧视女性和黑人,走完了争议的一生

DNA之父沃森去世。天才科学家歧视女性和黑人,走完了争议的一生

英国那些事儿
2025-11-08 23:16:14
小学生给校车敬礼后续:官方通报,最让人恶心的一幕却在评论区

小学生给校车敬礼后续:官方通报,最让人恶心的一幕却在评论区

奇思妙想草叶君
2025-11-08 20:18:19
唐朝古籍里发现月亮的离奇记载:表面凹凸不平,有8万名专人维修

唐朝古籍里发现月亮的离奇记载:表面凹凸不平,有8万名专人维修

丞丞故事汇
2025-11-09 12:50:18
拦婚车索要50条香烟的3人,已社会性死亡,结局舒适,评论区炸锅

拦婚车索要50条香烟的3人,已社会性死亡,结局舒适,评论区炸锅

三农老历
2025-11-09 14:46:14
2025-11-09 20:31:00
量子位 incentive-icons
量子位
追踪人工智能动态
11647文章数 176329关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

英伟达被华尔街大佬做空 4天市值蒸发4551亿美元

头条要闻

英伟达被华尔街大佬做空 4天市值蒸发4551亿美元

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

房产
艺术
教育
健康
公开课

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

艺术要闻

高234米!南非第一高楼,曾问鼎非洲之巅

教育要闻

来了来了上传啦!!传播学系统框架考前再复盘一遍(脑子丝滑滑!!!)

超声探头会加重受伤情况吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版