财联社9月16日电,在9月16日举行的2025腾讯全球数字生态大会上,腾讯集团副总裁、腾讯云总裁邱跃鹏透露,目前,腾讯云已在推理加速、Agent Infra和国际化布局等方面取得突破,腾讯云正不断升级云基础设施,以支撑Agent规模化落地和企业全球化发展。邱跃鹏介绍,在推理加速方面,腾讯云深入参与开源贡献,向DeepSeek、vLLM、SGLang等社区提交了多项优化技术。针对大模型推理面临的内存瓶颈,腾讯云自研并开源FlexKV多级缓存技术,大幅降低KVCache的占用,将首字时延降低多达70%。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.