2月16日,智谱通过官方渠道发布消息称,近期全球范围内对其新一代旗舰模型GLM-5的需求激增,并发访问量已突破既有规划的上限,导致服务出现排队、响应延迟及卡顿等问题,部分用户体验受到影响。对此,智谱表示歉意。
智谱在公告中坦言,尽管公司已多次对国产芯片集群进行扩容,并采取限量发售GLM Coding Plan套餐等措施,仍无法彻底缓解当前供不应求的局面。为应对持续攀升的算力压力,智谱正式启动"算力合伙人"招募计划,面向三类合作方发出邀约:一是芯片厂商,智谱表示愿意开放核心技术接口,联合开展针对GLM-5的底层优化;二是算力伙伴与推理服务商,双方可共建更高并发、更低延迟的推理网络;三是其他形式的算力合作。
据智谱此前披露,GLM-5于2月12日正式上线并开源。该模型主打编程与智能体能力跃升,参数量从上一代的355B(激活32B)扩展至744B(激活40B),预训练数据从23T token提升至28.5T token。在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。
值得注意的是,就在GLM-5发布同日,智谱宣布取消GLM Coding Plan套餐的首购优惠并上调价格,整体涨幅自30%起,成为国产大模型近期首次大幅提价。长江证券研报指出,"模型正式进入需求时代。国内模型之前API价格大幅低于海外,伴随模型逐步追赶好用性实用性提升正式进入需求驱动时代。智谱模型涨价验证新时代开启,国内模型厂商MaaS业务有望迎来大爆发,毛利率有望快速提升。"
此次"算力合伙人"招募,是智谱首次以开放合作的方式向外部寻求算力资源支持,也折射出当前国产大模型在用户规模快速扩张下面临的算力瓶颈。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:观察君
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.