网易首页 > 网易号 > 正文 申请入驻

百度百舸持续开源生产级代码,联合SGLang 社区打造先进 AI Infra

0
分享至

当前,Token 的消耗量呈现出年均百倍增长的态势。国家数据局统计显示,截至今年6月底,我国日均Token消耗量从2024年初的1000亿,已经突破至30万亿,1年半时间增长了300多倍。

随着以DeepSeek、Ernie 为代表的 MoE 类推理模型爆火,大规模分布式推理系统的建设成了支持 AI 落地的挑战。推理成本、推理效率、推理稳定性,正在取代参数规模,成为决定AI商业化上限的关键变量。

围绕这一新的行业挑战,在12月14日由百度百舸与SGLang社区联合主办的技术分享活动上,百度百舸将自己在生产系统上的最新实践成果,SGLang将业界最新成果和动态,做了一次系统性分享。

百度百舸持续开源生产级代码,联合 SGLang 社区打造先进 AI Infra

在活动开场致辞中,百度智能云AI计算首席科学家王雁鹏明确表示:百度百舸正在将生产级代码持续开源到开源社区。百度在大规模生产环境中积累的大模型训推系统的各种能力,包括经过大规模系统打磨过的高度稳定的、高度优化的各种核心组件,都将逐一向行业分享。

同时,王雁鹏强调,开源并非一时的决定,而是百度坚信的技术方向和演进路径。未来,百度会持续联合各个社区,以开源的力量推动行业共同成长。



(百度智能云AI计算首席科学家王雁鹏)

作为大模型时代崛起的重要开源项目之一的SGLang,百度智能云10月份携手SGLang社区,将一套针对DeepSeek-V3.2推理性能优化的 MTP(Multi-Token Prediction,多token预测)技术代码正式开源。SGLang 社区表示这是一项巨大的贡献,社区实测显示,采用这套技术,DeepSeek-V3.2模型解码吞吐量能提升超过2倍。



在王雁鹏看来,推理引擎正变得越来越重要。智能经济时代,推理引擎消耗的算力,将成为最核心的生产资料。如果推理成本做不到足够低,身处大模型产业链上的玩家,就将失去竞争力,难以获取Scaling的效益。

在本次 Meetup 中,百度百舸团队围绕如何建设大规模分布式推理基础设施、DeepSeek V3.2 推理引擎等方面展开了系统性分享。

百度主任架构师田健重点介绍了百度百舸在大规模分布式推理集群基础设施上的实践。

随着大模型到达千亿、万亿规模的时代,其推理的部署也遇到了“不可能三角”的挑战,需要在模型规模指数级增长、部署效率与稳定性和资源成本与弹性之间,寻求新的平衡。

百度百舸新一代大规模分布式推理基础设施,以三大核心支柱破解大模型部署困局:通过自动化编排将分布式实例“原子化”,大幅简化跨节点管理复杂度;创新“静默实例”技术实现秒级资源激活,灵活应对潮汐流量;依托高性能流量调度与“班车调度”算法,极致压榨集群性能。

百度高级架构师刘伟分享了百度百舸基于万卡级生产系统实战经验,面向DeepSeek V3.2在推理引擎层面做的深度优化工作:通过轻量级CP让长文本推理的TTFT近乎线性降低,更创新研发ESS系统破解长文本推理的显存墙困境。

面对DeepSeek V3等MoE模型部署中FFN计算密度不足、GPU利用率低的痛点,百度高级工程师刘国维带来了百度百舸在DeepSeek V3系列模型上的AE分离框架实战,展示了在复杂并行与分离架构下,百度百舸如何在性能、稳定性与运维复杂度之间取得工程平衡。

SGLang 社区:推理框架的边界正在被不断拓展

来自SGLang 社区的 5 位开发者分享 了4 个业内最新进展,展现了 SGLang 社区在行业最前沿的动态。

SGLang 核心开发者张懿带来了SGLang在Linear Model优化与Diffusion支持上的最新进展。

随着长序列推理场景等的普及,传统KV Cache管理方式面临挑战。SGLang 在内存管理、投机推理适配等方面进行了大量工程优化,使推理框架能够更好地适配新一代模型结构。

在此基础上,面向DeepSeek等主流模型所指向的统一模型技术迭代路线,SGLang也在尝试从语言模型走向统一生成引擎。11月上线的SGLang Diffusion,便对外释放了一个强烈信号,即SGLang的目标并不是一个LLM引擎,而是统一推理执行层。

来自SGLang Diffusionteam的范舒翼、陈茜,系统介绍了面向图像与视频生成的高性能推理引擎 SGLang Diffusion。在图像与视频生成场景中,SGLang Diffusion通过Pipeline组合、并行策略与Kernel复用,将Diffusion推理性能整体拉升到Diffusers的2–6倍区间,为未来DeepSeek等“理解+生成”统一模型的问世,预留了系统优化空间。

在推理加速方向,SGLang开发者李升桂带来了SpecForge项目,解决了投机推理在真实系统中落地难、稳定性差的问题,让这一理论上成熟的方法,真正具备工程可用性。

同时,来自SGLang RL Team成员李冀,也展示了SGLang在强化学习场景下的最新进展,进一步拓展了推理框架的适用边界。

随着大模型发展重心从训练范式加速转向推理范式,Token消耗需求呈现出远超以往的增长曲线。百度将持续联合开源社区,打造行业领先的AI Infra,不断逼近推理系统的上限,持续满足行业对Token消耗年增百倍的诉求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

爱吃醋的猫咪
2026-02-27 17:56:07
印度发生两起爆炸事故造成至少38人丧生

印度发生两起爆炸事故造成至少38人丧生

新华社
2026-03-01 16:35:09
退钱了!今天开始,个税汇算清缴首日网友晒退税额,有人凌晨退了3万多,有人需补缴

退钱了!今天开始,个税汇算清缴首日网友晒退税额,有人凌晨退了3万多,有人需补缴

每日经济新闻
2026-03-01 13:54:35
A股:中东黑天鹅突袭,明天低开已成定局,历史或将再次重演?

A股:中东黑天鹅突袭,明天低开已成定局,历史或将再次重演?

云鹏叙事
2026-03-01 16:03:53
“七十不添衣,八十不祝寿”,这句话指的是啥?看完后涨知识了

“七十不添衣,八十不祝寿”,这句话指的是啥?看完后涨知识了

阿龙美食记
2026-02-26 14:30:14
尼泊尔“一妻多夫”该如何生活?妻子苦不堪言:一点都不幸福。

尼泊尔“一妻多夫”该如何生活?妻子苦不堪言:一点都不幸福。

百态人间
2025-11-06 05:45:02
怎么也想不通,她长这么漂亮,演技那么好,为啥一直火不起来呢

怎么也想不通,她长这么漂亮,演技那么好,为啥一直火不起来呢

草莓解说体育
2026-03-01 00:47:24
男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

篮球快餐车
2026-03-01 00:42:22
专家分析:多国卷入 伊朗打击美中东基地 导弹数量和突防是关键

专家分析:多国卷入 伊朗打击美中东基地 导弹数量和突防是关键

财联社
2026-02-28 19:39:41
特朗普应该想不到:他对伊朗的灭国之战,让中俄欧看清了一个真相

特朗普应该想不到:他对伊朗的灭国之战,让中俄欧看清了一个真相

头条爆料007
2026-02-28 18:49:20
研究警告:越来越多家庭因吃它中毒!冰箱里这类肉别超3个月!

研究警告:越来越多家庭因吃它中毒!冰箱里这类肉别超3个月!

全球军事记
2026-02-28 10:12:38
马年首虎!涉嫌严重违纪违法,韩嵩被查

马年首虎!涉嫌严重违纪违法,韩嵩被查

中国基金报
2026-02-28 20:55:42
放假半天!不补休

放假半天!不补休

小易商丘
2026-03-01 10:00:47
哈梅内伊刚死,美媒一语惊人: 看来对中国来说,伊朗并没那么重要

哈梅内伊刚死,美媒一语惊人: 看来对中国来说,伊朗并没那么重要

肖兹探秘说
2026-03-01 14:45:20
肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

小椰的奶奶
2026-03-01 10:32:16
哈梅内伊的死,将了特朗普的军!哈梅内伊最后“阳谋”,有多毒?

哈梅内伊的死,将了特朗普的军!哈梅内伊最后“阳谋”,有多毒?

军机Talk
2026-03-01 14:05:59
男篮世预赛-连场逆转!中国100-93中国台北 两连胜掌握出线主动权

男篮世预赛-连场逆转!中国100-93中国台北 两连胜掌握出线主动权

现代小青青慕慕
2026-03-01 19:09:39
下午4点,中国男篮vs中国台北!传来1坏消息,爆冷输球=沦为垫底

下午4点,中国男篮vs中国台北!传来1坏消息,爆冷输球=沦为垫底

侃球熊弟
2026-03-01 00:07:19
外资突然大抛售韩国股票!全球“最牛”股市,发生了什么?

外资突然大抛售韩国股票!全球“最牛”股市,发生了什么?

21世纪经济报道
2026-03-01 17:22:12
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

谈史论天地
2026-02-10 08:16:24
2026-03-01 19:31:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10334文章数 489472关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

普京就哈梅内伊遇害表示哀悼:一次无耻杀害

头条要闻

普京就哈梅内伊遇害表示哀悼:一次无耻杀害

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

教育
健康
手机
数码
家居

教育要闻

这题目做了真的是懵啊,还好老师讲过

转头就晕的耳石症,能开车上班吗?

手机要闻

卢伟冰宣布3月2日MWC现场直播 发布小米17 Ultra徕卡版新配色

数码要闻

小米首款追踪器!小米Tag海外正式发布 兼容iOS 120元起

家居要闻

素色肌理 品意式格调

无障碍浏览 进入关怀版