4月8日,据华为消息,智谱(02513.HK)正式发布新一代旗舰模型GLM-5.1,发布当天已上线华为云,并成功对接华为云多款产品。该模型整体能力全面提升,是目前全球最强的开源模型,Coding能力刷新全球最佳成绩,在长程任务(Long Horizon Task)处理能力上实现突破,能够在单次任务中持续、自主地工作长达8小时,交付完整的工程级成果。
智谱GLM-5.1在昇腾算力上实现了Layer级MOE绝对均衡,通过框架能力优化让专家均衡产出Token,同时结合昇腾Attention算子特征,通过推理框架和硬件协同的定向优化,大幅提升算力均衡和HBM访存均衡能力。华为云通过系统级优化,实现推理加速,整体吞吐提升30%。
当前,华为云MaaS模型即服务平台已为开发者提供免部署、一键调用智谱GLM-5.1 API的Tokens服务,支持在线体验。企业也可通过华为云魔坊(ModelArts)模型训推平台,一键完成推理服务部署上线,支持公共池和专属池两种资源部署方式,满足独占和非独占算力的使用诉求,全方位护航企业使用模型服务的连续性与稳定性。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.