网易首页 > 网易号 > 正文 申请入驻

吃瓜,大模型推理引擎,vLLM和SGLang 杠起来了

0
分享至

大家好,我是 Ai 学习的老章

vLLMSGLang是大模型领域最著名、热度最高的两个推理引擎,也都是 DeepSeek 推荐使用的推理引擎。

vLLM 45.3K 星标
项目:https://github.com/vllm-project/vllm
文档:docs.vllm.ai

SGLang 13.4K 星标
项目:https://github.com/sgl-project/sglang
文档:docs.sglang.ai/

纯个人感受,我还是比较喜欢 vLLM,之前多次用 vLLM 引擎部署过大模型:

说回标题,vLLM 前几天发了一个性能更新的推,测试了在 8x H200 上,vLLM 在 DeepSeek V3/R1 模型的吞吐量方面领先,还期待与 DeepSeek 的推理引擎开源计划合作,实现进一步的提升。

这里面有两个点

一是它配图中对比了不同场景下与 SGLang 和 TensorRT 这两个推理引擎的对比数据,vLLM 短进短出情况下遥遥领先,后面几个场景中 SGLang 甚至被 TensorRT 超越

二是它期待的与 DeeSeek 的开源合作,这是前几天 DeepSeek [[2025-04-19-刚刚,DeepSeek 宣布,准备开源推理引擎]] 中说到其开源引擎是基于 vllm 魔改,准备开源

然后 SGLang 直接回应了这条,并置顶了回复:我们对比了 vLLM 0.8.4 和 SGLang 0.4.5.post1 的离线性能。基准测试结果表明,SGLang 在所有情况下都优于 vLLM,大多数情况下领先约 10%,最大领先幅度为 38%。

也有网友表示,可以轻松调整 SGLang,使其性能比 vLLM 高出 23%。

lmsysorg 联合创始人 Lianmin Zheng 亲自下场,表示 vLLM 发布的基准测试结果存在明显的误导性,SGLang 官方可以测出比 vLLM 更好的结果。并生成这已经不是 vLLM 第一次分享误导性信息,应该考虑删除这篇帖子以维护声誉。

然后 vLLM 连续发布了两个测试结果,表示没有发布误导性的结果,它可以通过精确的命令和环境重现。

Lianmin Zheng 说vLLM后续这两张图中 TRT - LLM 结果在 ShareGPT 上比之前快两倍,在 1k - in - 2k - out 上比之前快 1.6 倍,SGLang 也是如此,这恰好证明了之前的结果存在误导性。

话说,类似测试、打脸、再测试属实没什么意义。各家的推理引擎都在不断进行各种优化,即便是同一版本的模型,各家进行测试时,本身就更倾向于对自家引擎的各种参数设置上多加权衡,而对竞争对手的引擎的参数可能考虑就没有那么多了。

这一波,我站SGLang,vLLM自己测试可以,在某个版本上提升多少随便怎么吹都可以,没必要拉上SGLang和TensorRT。

最后,我建议两家别吵了,同时建议大家感受一下我最近在用的 Xinferece v 1.5,它直接支持了vllm、sglang、llama.cpp、transformers、MLX等推理引擎,还提供了可视化界面管理各种大模型。

配置与使用方式详见文档:https://inference.readthedocs.io/zh-cn/latest/models/virtualenv.html

更新指南

  • pip:pip install 'xinference==1.5.0'

  • Docker:拉取最新版本即可,也可以直接在镜像内用 pip 更新。

️ 功能增强

  • Gradio 聊天界面支持展示思考过程(需打开“解析思维过程”)

  • Vision 模型支持 min/max_pixels 控制输入分辨率

  • 模型下载支持进度显示与取消

  • ⚙️ 默认并发数设置为 CPU 核心数

  • 支持 InternVL3 的 AWQ 推理

  • ️ 默认使用最新版 xllamacpp 引擎

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国务院免去他国务院副秘书长职务,已“空降”厦门任市委书记

国务院免去他国务院副秘书长职务,已“空降”厦门任市委书记

上观新闻
2026-04-21 12:28:10
郑丽文成功了!国民党3位元老出山,朱立伦的反扑计划宣告失败

郑丽文成功了!国民党3位元老出山,朱立伦的反扑计划宣告失败

米果说识
2026-04-21 16:58:00
拼多多暴力抗法震惊全网,市值万亿巨头为何如此嚣张

拼多多暴力抗法震惊全网,市值万亿巨头为何如此嚣张

燕梳楼频道
2026-04-20 21:12:04
细思极恐!某国产大模型泄露用户隐私,并随意将隐私信息发给其他人

细思极恐!某国产大模型泄露用户隐私,并随意将隐私信息发给其他人

可达鸭面面观
2026-04-21 16:24:39
美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

观察者网
2026-04-21 10:56:03
伊朗军舰军演返航曾遭美军击沉87人死亡,幸存船员讲述:毫无预警,他们的目标是杀人

伊朗军舰军演返航曾遭美军击沉87人死亡,幸存船员讲述:毫无预警,他们的目标是杀人

红星新闻
2026-04-21 18:27:32
追到1-1!华子30+10森林狼19分逆转掘金 约基奇24+15+8穆雷30分

追到1-1!华子30+10森林狼19分逆转掘金 约基奇24+15+8穆雷30分

醉卧浮生
2026-04-21 13:26:05
34岁韦东奕官宣喜讯,恭喜!

34岁韦东奕官宣喜讯,恭喜!

二胡的岁月如歌
2026-04-21 15:37:16
女子21万全款购车后发现该车为“展车”,4S店称“工作失误” 当地市监部门已介入

女子21万全款购车后发现该车为“展车”,4S店称“工作失误” 当地市监部门已介入

红星新闻
2026-04-21 14:51:54
黄大发等涉黑案一审宣判:黄大发等12人组织、领导、参加黑社会性质组织,判处黄大发死刑,其他11名被告人分别判处13年至2年2个月不等刑罚

黄大发等涉黑案一审宣判:黄大发等12人组织、领导、参加黑社会性质组织,判处黄大发死刑,其他11名被告人分别判处13年至2年2个月不等刑罚

扬子晚报
2026-04-21 15:07:17
“领小姐姐看电影不买吃喝好意思么”,山东临沂一影院条幅令人不适,当地:已要求处理

“领小姐姐看电影不买吃喝好意思么”,山东临沂一影院条幅令人不适,当地:已要求处理

潇湘晨报
2026-04-21 16:44:21
我和 AI 搭子工作了一周,再也回不去了

我和 AI 搭子工作了一周,再也回不去了

爱范儿
2026-04-21 17:31:39
震惊!济南一国企总工的优质男,将未接种新冠疫苗列为择偶硬条件

震惊!济南一国企总工的优质男,将未接种新冠疫苗列为择偶硬条件

火山詩话
2026-04-21 08:54:26
越来越清晰:只剩革命卫队问题还没解决,未来会被内外联合绞杀吗

越来越清晰:只剩革命卫队问题还没解决,未来会被内外联合绞杀吗

民间胡扯老哥
2026-04-21 05:45:15
盘踞武汉多年“黑老大”黄大发等12人组织、领导、参加黑社会性质组织案一审宣判

盘踞武汉多年“黑老大”黄大发等12人组织、领导、参加黑社会性质组织案一审宣判

澎湃新闻
2026-04-21 14:58:02
“当场就吐了”,山姆一网红产品被曝吃出蛆虫!市民称“门店很傲慢”

“当场就吐了”,山姆一网红产品被曝吃出蛆虫!市民称“门店很傲慢”

深圳晚报
2026-04-21 15:01:34
商家发视频吐槽:景区人满为患,却无人消费,评论区全是人间清醒

商家发视频吐槽:景区人满为患,却无人消费,评论区全是人间清醒

谭谈社会
2026-04-21 10:12:09
比亚迪大唐EV北京车展开启预售:950km续航全球第一

比亚迪大唐EV北京车展开启预售:950km续航全球第一

快科技
2026-04-21 17:48:45
中超争议判罚!新鹏城进球被吹,球员集体不满,侯森逃过一劫

中超争议判罚!新鹏城进球被吹,球员集体不满,侯森逃过一劫

奥拜尔
2026-04-21 19:33:07
匈牙利当选总理毛焦尔:我和以色列总理内塔尼亚胡明白说了,他若入境我国,必将被逮捕

匈牙利当选总理毛焦尔:我和以色列总理内塔尼亚胡明白说了,他若入境我国,必将被逮捕

极目新闻
2026-04-21 12:29:14
2026-04-21 21:07:01
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3341文章数 11139关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

六层楼高大树"偷"走家里光线 女子起诉隔壁小区业委会

头条要闻

六层楼高大树"偷"走家里光线 女子起诉隔壁小区业委会

体育要闻

62岁,成为中国足坛最火的人

娱乐要闻

周润发时隔16年再卖楼,变现数亿资产

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

艺术
亲子
旅游
手机
公开课

艺术要闻

任伯年写竹,真带劲

亲子要闻

专注力对孩子的影响超乎想象,你可能错过了一个学霸

旅游要闻

欢迎来到“家家泉水户户垂杨”体验区——济南!“沿着黄河遇见海”全国旅行商山东行——“相约文旅盛会 发现宝藏山东”采风活动带你了解不一样的济南~

手机要闻

OPPO Find X9 Ultra把增距镜塞进手机里:史无前例

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版