极目新闻记者 赵贝
通讯员 邹子聪
算力用不完怎么办?不同规格算力和使用场景不匹配怎么办?5月11日,极目新闻记者从湖北大数据集团算力科技有限公司获悉,由该公司建设运营的湖北算力互联互通平台近日推出Token算力服务,将各种规格的底层算力封装成大模型Token。相当于为各类算力资源统一了“度量衡”,让老旧的芯片和闲散的算力资源重新发挥作用。
Token,即词元,是模型处理信息的最小计量单位,其调用量已成为衡量AI模型活跃度和产业价值的关键指标。相关数据显示,截至今年3月,我国日均词元(Token)调用量已超过140万亿。
湖北算力互联互通平台是全省算力调度服务与运营核心载体,已于2025年9月平台门户正式上线,现已接入武汉、宜昌、襄阳三大算力集群及三大运营商算力资源,实现可监测算力超7000P、可调度算力超2000P,构建起“通算、超算、智算、边缘计算、量子计算、天基计算、类脑计算”七算合一的发展格局。
![]()
该平台相关负责人介绍,日常运营过程中发现,在传统的“硬件租赁”模式下,不少算力中心因为可提供的算力规模和算力规格与客户的使用场景不匹配,会存在一定的“闲置算力”。例如一些型号比较旧、规格比较小众的芯片,市场需求量偏小,闲置的可能性就比较高;此外,客户可能对租赁服务器的数量有要求,那么算力中心的零星算力也不太容易租出去;算力中心一般还会保留少量未上架的冗余算力,用于应对用户的紧急需求。这部分闲置算力虽然占比不大,但借助平台的算力汇聚和调度能力,仍可以有效利用起来。
“我们与省内算力中心合作,在不同芯片规格的闲置算力资源池之上搭建大模型推理框架,根据资源规格和规模的实际情况,部署DeepSeek-V4、GLM-5.1、MiMo-VL-7B等不同参数规模的开源模型形成标准化API服务接口,再通过平台的Token网关进行接入,面向用户提供统一的Token服务。”该平台相关负责人介绍,平台将底层算力封装为Token服务,可以简单理解为将各类算力资源“统一度量衡”,用户只需通过API调用,闲置算力就可以重新焕发生机。
同时,该平台还接入了通义千问、文心一言、混元等商业大模型,通过集采模式压低成本,为需要顶级模型能力的客户提供服务。
(来源:极目新闻)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.