金融界2025年5月20日消息,国家知识产权局信息显示,北京中科金财科技股份有限公司申请一项名为“基于Triton-Inference-Server的大模型高性能推理加速方法及系统”的专利,公开号CN120012915A,申请日期为2024年12月。
专利摘要显示,本发明公开了基于Tr iton‑I nference‑Server的大模型高性能推理加速方法及系统,所述方法包括S1、接收用户提供的模型配置信息,根据模型配置检测是否存在本地模型拷贝,若不存在,则从远程存储下载模型并生成符合推理服务器要求的配置文件,S2、支持用户上传定制化模型或微调模型,并对模型进行加载、优化和参数融合,S3、根据用户需求对模型进行量化处理,采用多种量化方法以优化推理性能;该基于Tr iton‑I nference‑Server的大模型高性能推理加速方法及系统,解决了现有技术多模型推理服务系统在管理复杂性、高时延、低吞吐量及服务鲁棒方面方面的局限性的问题。
天眼查资料显示,北京中科金财科技股份有限公司,成立于2003年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本34005.1995万人民币。通过天眼查大数据分析,北京中科金财科技股份有限公司共对外投资了21家企业,参与招投标项目3802次,财产线索方面有商标信息38条,专利信息115条,此外企业还拥有行政许可14个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.