6月26日至27日,AICon全球人工智能开发与应用大会将在上海举办。快手科技社区科学部推荐架构高级专家贾荣来确认出席"人工智能前沿技术探索"专题,将围绕《生成式推荐引擎升级,快手在线参数服务器性能与时延深度优化实践》发表主题演讲。
在线参数服务器(ParameterServer)是模型推理的核心组件,负责海量模型参数的存储、更新与同步。随着模型规模扩张和在线请求量激增,传统架构的瓶颈日益明显:存储引擎在高频参数读写场景下延迟高、并发能力不足;基于TCP/IP的网络通信则面临带宽利用率低、传输延迟大的问题。
![]()
快手项目团队从存储与网络两个维度推进技术革新。存储层引入SIMD并行计算、内存预取、按TTL分层的精确过期与强制回收机制,极限吞吐提升50%以上。网络层通过RDMA重构通信链路,极限吞吐提升270%,时延降至原来的三分之一。
贾荣来毕业于哈尔滨工业大学,曾任职于腾讯、百度,专注广告系统、模型训练与分布式存储领域,目前在快手负责分布式存储相关工作。本次演讲将覆盖大模型时代的挑战、存储引擎性能突破、RDMA通信链路重构及未来展望,为听众提供高并发、高时延场景下的工程优化方法论。
除该专题外,大会还设置端侧AI、Agent架构与工程化实践、企业级研发体系重构等14个论坛,50余位来自腾讯、阿里、华为、飞猪等企业的技术负责人及高校专家将分享一线实践经验。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.