中经记者 谭伦 苏州报道
5月8日,在苏州举行的2026移动云大会上,中国移动正式发布移动模型服务平台MoMA。据悉,MoMA目前已接入超300款业界主流AI模型,首创Token集约化运营模式,主打“一次接入、智能优选、普惠可用、安全可信”的一站式模型服务体系,覆盖政务、金融、工业、医疗、教育等多类应用场景。平台通过统一API网关和智能路由机制,让用户一次接入即可调用多模型资源,也为AI应用规模化落地提供了更轻量的入口。
在效率与成本上,MoMA平台基于国产算力部署自研推理引擎,并结合长尾模型调度、智能缓存、上下文复用和Token压缩等技术,单位Token成本压降约30%,资源占用率降低50%以上;同时,流式实时计费让Token计费端到端时延不超过1分钟,解决传统按包计费下透明度不足、资源浪费等问题。
安全方面,MoMA推出了“机密模型”服务,将模型部署在机密容器中,以硬件隔离实现“可用不可见”,为政务、金融等高安全场景提供支撑。
公开信息显示,MoMA并非一次单点发布,而是中国移动AI能力体系的重要中枢。此前,中国移动曾将MoMA定位为平台级MaaS服务中枢引擎,强调其可紧扣行业场景自动匹配最优专家模型和专用智能体;今年3月,中国移动曾披露,MoMA聚合服务引擎已汇聚数百个优质大模型和数万个应用工具。此次正式发布,显示中国移动正加速把算力、模型与应用打通,推动AI服务从“单模型调用”向“平台化运营”升级。
(编辑:张靖超 审核:李正豪 校对:颜京宁)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.