天眼查App显示,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利近日公布。摘要显示,该发明涉及人工智能领域,有益效果在于将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,均衡负载任务,实现最大化的硬件利用,减少闲置算力,降低整体延迟,提高吞吐量,增强系统的扩展性和容错性。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.