网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

vLLM团队创业，种子轮10.5亿！清华特奖游凯超加盟

2026-01-25 09:45:18　来源: 算法与数学之美

北京举报

0

分享至

开源模型都在用的重要推理框架vLLM，核心团队宣布创业了！

创始团队官宣，成立新公司Inferact，种子轮即斩获1.5亿美元（约10.5亿人民币）融资，估值达8亿美元（约56亿人民币）。

这一规模创下了近期AI基础设施领域的融资新高，也是有史以来规模最大的种子轮融资之一。

投资方指出，随着AI应用落地，行业焦点正从训练转向推理，如何低成本、高可靠地运行现有模型已成为新的痛点。

Inferact正是为了解决这一“推理瓶颈”而生，旨在构建下一代商业引擎以应对大规模部署挑战。

出任CEO的Simon Mo也表示，这反映了市场机遇的广阔，因为在推理规模化阶段，即使是微小的效率提升也能带来显著的成本节省。

vLLM商业化，Inferact正式成立

本次1.5亿美元的种子轮融资由Andreessen Horowitz（a16z）与Lightspeed Venture Partners共同领投。

除了两大领投方，跟投名单中还出现了红杉资本（Sequoia Capital）、Altimeter Capital、Redpoint Ventures以及真格基金（ZhenFund）。

如此豪华的投资规模集中在一家刚成立的初创公司身上，显示出资本市场对于AI基础设施赛道风向的剧烈转变。

a16z合伙人Matt Bornstein指出，随着大模型能力趋于成熟，开发者已不再单纯等待模型架构的更新，而是开始大规模部署现有模型。

这一转变带来了新的难题，即当应用程序需要频繁与大模型进行交互时，算力成本和系统负载会呈指数级上升，推理环节因此成为制约行业发展的最大瓶颈。

市场对于低成本、高可靠运行现有模型的需求，目前已经超过了对新模型研发的期待。

作为Inferact的技术基石，vLLM在此之前已经进入了工业界的实际生产环境。

亚马逊目前已采用该技术，而且是直接应用于自身核心购物应用的内部系统。

这种来自万亿级商业场景的实际部署，在真实的高并发流量下验证了技术的稳定性，也让资本市场看到了技术在大规模商业落地上的确定性。

面对开源与商业化的平衡问题，Inferact目前的策略是维持双线并行。

公司明确表示将继续支持vLLM作为一个独立的开源项目发展，并将技术改进回馈给社区。

在商业层面，团队将目光投向了硬件适配的效率问题，计划开发独立的商业产品，帮助企业在不同类型的硬件上运行AI模型。

从vLLM到Inferact

vLLM创立之初，团队自己都认为是一个“副业”项目。

但如今的Inferact时刻前夕，vLLM已成为大模型领域的事实标准，几乎所有主流开源大模型在发布与部署时，都会将vLLM作为首选支持的推理框架。

在a16z合伙人Matt Bornstein主持的深度对谈中，Simon Mo和Woosuk Kwon回溯了vLLM如何从一个不起眼的“副业”一步步走到聚光灯下的全过程。

最初，vLLM仅仅是两人在伯克利求学期间的一个Side Project，驱动代码更新的动力源于一种极其朴素的技术信仰——

他们坚信，在这个大模型重塑世界的时代，开源代码必须是全球AI基础设施的地基。

这种纯粹的初衷，让vLLM在没有商业推广的情况下，迅速成为了开发者社区的宠儿。

然而，随着项目从实验室走向工业界，团队的角色发生了质的转变。

作为核心维护者，他们不仅是在写代码，更是在与全球最顶尖的开发者协作，这种高强度的社区互动成为了他们技术能力的“炼金石”。

他们积累了独有的技术洞察，并确立了在行业内的权威身份，构成了后来他们能够驾驭一家独角兽企业的底层能力。

但在这一过程中，现实的引力也越来越重。他们发现，当推理任务从简单的Demo演示变成数千张GPU集群的生产级部署时，挑战的量级呈指数级上升。

“推理正在变得越来越难”，这是团队在第一线摸爬滚打后得出的痛切结论。

现有的开源方案在面对深度底层优化、大规模集群的线性扩展以及复杂的GPU部署流程时，往往显得力不从心。

企业需要的不再是零散的代码库，而是能够稳定承载万亿次调用的工业级引擎。

为了攻克那些开源社区难以消化的“硬骨头”，必须引入严密的商业组织形式构建下一代引擎。

与此同时，为了在商业化的同时保证开源项目继续运行，Inferact设计了一套独特的反哺机制，利用商业资源继续滋养vLLM，确保这个曾经的副业项目能继续作为行业的基石繁荣生长。

伯克利博士携手清华特奖

Inferact的CEO由Simon Mo担任。

他曾就读于加州大学伯克利分校电气工程与计算机科学系（EECS），主攻机器学习系统设计方向。

在此之前，他是Anyscale的早期工程师，积累了将分布式系统科研成果转化为工业级产品的工程实践经验。

作为vLLM项目的原始维护者之一，他主要负责项目的工程化构建与社区运营。

另一位联合创始人是vLLM项目的发起人Woosuk Kwon。

他拥有加州大学伯克利分校计算机科学博士学位，师从Ion Stoica教授，研究重点聚焦于大语言模型的高效服务系统。

他在博士期间提出了Paged Attention算法，通过引入操作系统中分页内存管理的思想，解决了KV Cache显存碎片化问题，这一算法创新为vLLM在吞吐量性能上的提升提供了核心技术支撑。

团队的核心技术力量还包括清华特奖得主游凯超（Kaichao You）。

他曾在加州大学伯克利分校EECS系担任访问学者，主攻分布式深度学习系统。

作为vLLM的关键维护者，他主导了基于张量并行的分布式推理功能实现，并优化了与PyTorch原生生态的集成接口，使得vLLM能够支持多卡大规模模型推理并降低了开发者的迁移成本。

此外，核心团队与顾问团还集结了学术界与工业界的资深力量。

前Roblox高级机器学习工程师Roger Wang作为核心成员加入，为团队带来了生产级基础设施的实战经验；

加州大学伯克利分校教授Joseph Gonzalez以及Databricks联合创始人Ion Stoica教授则作为顾问深度参与其中，为公司提供技术愿景与商业路径的顶层指导。

参考链接：
[1]https://www.bloomberg.com/news/articles/2026-01-22/andreessen-backed-inferact-raises-150-million-in-seed-round
[2]https://x.com/a16z/status/2014394081452163231

文章来源：量子位。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

上海基模独角兽阶跃星辰完成超50亿人民币B+轮融资印奇出任董事长

财联社 2026-01-26 09:09:04
0 跟贴 0
拿下星巴克中国，博裕资本什么来头？

华商韬略 2025-11-07 13:42:01
0 跟贴 0

中国大陆最北端宜家即将闭店，清仓商品遭大量顾客争抢，官方客服：人流量很大

齐鲁壹点 2026-01-25 20:14:24
222 跟贴 222

四大理由，让成都成为科技创新企业崛起的土壤

每日经济新闻 2025-12-23 22:54:45
0 跟贴 0
地下室杀出的中国品牌，把美国巨头踩在脚下

华商韬略 2025-11-06 15:53:03
0 跟贴 0

五家餐饮企业自述：如何在2025年获得增长？

经济观察报 2026-01-26 08:04:23
0 跟贴 0

无需外部数据！AI自问自答实现推理能力进化

量子位 2025-08-08 15:51:21
0 跟贴 0
耳朵流产？歌坛混子？一口气锐评内娱伯克利歌手！

电视这个圈儿 2026-01-25 19:32:31
4 跟贴 4

三角形是最小的吗？球面几何给出的意外答案

星星科普 2026-01-24 14:12:51
1 跟贴 1
打破心物之争！量子力学证明：意识物质皆为能量

万物研究 2026-01-25 17:57:03
23 跟贴 23
OpenAI头号叛徒，竟然是自学的AI?

量子位 2025-08-22 16:06:15
1 跟贴 1
真实，才是企业家的顶级人设

叶檀财经 2025-07-24 18:26:45
10 跟贴 10
《野性的呼唤》前主人富豪万般宠爱，奈何它精力旺盛拆家无度

欧阳春晓Aurora 2026-01-24 18:57:59
0 跟贴 0
专家：已有欧洲国家开始考虑"联合中国对抗美国"

澎湃新闻 2026-01-25 11:23:52
28128 跟贴 28128
斯坦福×英伟达发布AI推理新范式，刷新了多领域SOTA

新智元 2026-01-25 19:58:42
0 跟贴 0
从印度二本到Meta副总裁！被世界拒绝15次的他，撑起AI时代地基

新智元 2025-11-15 13:05:14
423 跟贴 423
他们在1993年就提出了Scaling Law

量子位 2025-09-03 10:24:41
0 跟贴 0
不读博士，照样进OpenAI！o1核心成员现身说法了

量子位 2026-01-25 20:04:15
0 跟贴 0
揭秘灯塔水母永生术：科学竟破解细胞重启之谜？

AI次世代 2026-01-25 06:34:25
0 跟贴 0
老话说：出门遇到3样东西，要绕道而行！并非迷信，有科学依据

纽毕斯 2026-01-25 11:59:11
0 跟贴 0
董明珠是逆行者，大家赞赏的是本分的企业家

叶檀财经 2025-12-17 19:14:36
0 跟贴 0
马斯克用Grok替代X员工，裁员90%

量子位 2025-11-29 16:58:47
6 跟贴 6
湖北首富雪中送炭救八路军，却被判入狱，40年后王震亲笔平反

世界军事格局 2026-01-22 03:53:55
0 跟贴 0
今日事今日读，2026年1月25日，有趣的新闻速览

郑凯伦伦伦 2026-01-25 08:11:50
0 跟贴 0
亿万富豪于东来小餐馆内主动向大家问好

奇闻吉 2026-01-23 14:02:21
71 跟贴 71
大学教授辞职收废品，一年狂揽300多亿

华商韬略 2025-11-06 10:42:15
1 跟贴 1
高中没毕业直接读博，17岁少女推翻40年数学猜想后的下一步

量子位 2025-08-08 15:39:19
0 跟贴 0
奥特曼谈马斯克：我曾视他为英雄，如今不再说话

量子位 2025-09-16 04:14:37
0 跟贴 0
人去世以后还能动？监控拍到不可思议的画面，是灵异还是科学？

曾博士 2026-01-21 18:23:00
6 跟贴 6
波士顿机器狗练成“轻功”！连续七个后空翻

量子位 2025-09-07 01:03:18
19 跟贴 19
连玻璃都能腐蚀，氢氟酸明明是弱酸，到底是如何做到的？

探谜未知世界 2026-01-24 11:40:27
4 跟贴 4
贝佐斯创业，马斯克嘲笑，两人的恩怨纠葛20年

量子位 2025-11-22 12:44:22
0 跟贴 0
葡萄的抗磁性

古衿科普录 2026-01-24 14:29:08
0 跟贴 0
中国富豪玩的有多变态

肥罗爱追剧 2026-01-22 08:16:08
4 跟贴 4
小姨子通过算计得到了富豪姐夫，可结局使双方付出了惨重的代价

小叮当剪辑 2026-01-23 08:42:42
0 跟贴 0
李四川民调领跑碾压苏巧慧，柯建铭策略变了，当众挑衅赖清德权威

军卫防务 2026-01-23 18:06:37
0 跟贴 0
段永平的投资哲学：把“退”当成人生指引

叶檀财经 2025-11-19 20:42:13
0 跟贴 0
转速高达15万转的马达你见过吗？

科普世界奇闻 2026-01-23 11:35:57
851 跟贴 851
马斯克下场抢人 xAI组建人才狙击队让工程师做HR 马斯克亲自组建xAI“人才狙击队”：让工程

量子位 2026-01-22 12:57:14
0 跟贴 0
印度首富女儿女婿，果然有钱就是不一样，看着样子都像老外！

微微看点 2026-01-24 14:44:04
0 跟贴 0

汪小菲下了好大一盘棋！小杨阿姨带两孩回京，张兰含泪准备分离

汪小菲下了好大一盘棋！小杨阿姨带两孩回京，张兰含泪准备分离

一盅情怀

2026-01-25 16:01:52

末节12分击溃青岛！健康的郭艾伦真稳！想得分就得分，根本拦不住

末节12分击溃青岛！健康的郭艾伦真稳！想得分就得分，根本拦不住

篮球资讯达人

2026-01-25 21:45:56

1996年，施瓦辛格在家中无事，和35岁200斤女佣发生不当关系

1996年，施瓦辛格在家中无事，和35岁200斤女佣发生不当关系

南权先生

2026-01-20 15:49:53

家长的控制欲能有多变态？网友：隔着屏幕都能感觉到这种窒息

家长的控制欲能有多变态？网友：隔着屏幕都能感觉到这种窒息

带你感受人间冷暖

2026-01-23 00:15:05

雷军无奈宣布：全部下架！

电动知家

2026-01-25 15:31:25

503：9，欧洲议会压倒性投票通过，让中国释放黎智英，中方回应

503：9，欧洲议会压倒性投票通过，让中国释放黎智英，中方回应

王姐懒人家常菜

2026-01-26 08:24:31

女护士处理男患者隐私部位，会感觉难为情吗？美女护士说出大实话

女护士处理男患者隐私部位，会感觉难为情吗？美女护士说出大实话

第7情感

2025-09-17 12:12:15

曼城31岁巨星愿加盟巴萨：今夏0转会费相当于白捡2700万

曼城31岁巨星愿加盟巴萨：今夏0转会费相当于白捡2700万

叶青足球世界

2026-01-25 20:35:06

生姜立大功？美国研究发现：生姜能在36小时清除60%老化细胞？

生姜立大功？美国研究发现：生姜能在36小时清除60%老化细胞？

蜉蝣说

2026-01-24 16:45:07

外媒：中国驳斥马斯克说法！

电动知家

2026-01-24 15:33:08

中国队丢冠仅1夜，队长赴英超！王钰栋遭批：态度有问题基本废了

中国队丢冠仅1夜，队长赴英超！王钰栋遭批：态度有问题基本废了

侃球熊弟

2026-01-25 10:37:48

梅洛尼：强烈愤慨，决定召回大使

梅洛尼：强烈愤慨，决定召回大使

上观新闻

2026-01-25 20:27:05

深度揭秘 | 航空“老色虎”谭瑞松，搞权色交易、“靠军工吃军工”

深度揭秘 | 航空“老色虎”谭瑞松，搞权色交易、“靠军工吃军工”

一分为三看人生

2026-01-12 00:09:36

Lisa去车公庙上香，穿lululemon瑜伽裤臀很翘，她素颜长相很普通

Lisa去车公庙上香，穿lululemon瑜伽裤臀很翘，她素颜长相很普通

有范又有料

2026-01-25 19:23:45

5.00-1.17！王欣瑜冲澳网8强，2-1爆冷？拭目以待，比赛时间如下

5.00-1.17！王欣瑜冲澳网8强，2-1爆冷？拭目以待，比赛时间如下

侃球熊弟

2026-01-26 00:15:03

三十岁高颜值少妇卖淫：一次仅百元，时长不限，一画面信息量大

三十岁高颜值少妇卖淫：一次仅百元，时长不限，一画面信息量大

博士观察

2026-01-25 20:18:40

知名制片人姜莹莹被腾讯解聘，移送公安局，给出的原因太恶劣！

知名制片人姜莹莹被腾讯解聘，移送公安局，给出的原因太恶劣！

一盅情怀

2026-01-25 15:54:20

随着利雅得新月1-1,沙特联最新积分出炉:C罗率队逼近榜首

随着利雅得新月1-1,沙特联最新积分出炉:C罗率队逼近榜首

侧身凌空斩

2026-01-26 04:08:11

一夜之间！金饰1克突破1500元

一夜之间！金饰1克突破1500元

南方都市报

2026-01-23 11:02:43

离谱！25岁前女足球员喊王钰栋父亲“岳父” ：这门亲事考虑一下

离谱！25岁前女足球员喊王钰栋父亲“岳父” ：这门亲事考虑一下

念洲

2026-01-26 07:07:34

算法与数学之美

分享知识，交流思想

5320文章数 64599关注度

往期回顾全部

财经要闻

现货黄金历史首次突破5000美元

头条要闻

牛弹琴：特朗普非常难过发文祈祷"中国别接管加拿大"

头条要闻

牛弹琴：特朗普非常难过发文祈祷"中国别接管加拿大"

体育要闻

中国足球不会一夜变强，但他们已经创造历史

娱乐要闻

央八开播杨紫胡歌主演的40集大剧来了

科技要闻

三星闪存，涨价100%

汽车要闻

别克至境E7内饰图曝光新车将于一季度正式发布

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

艺术

手机

健康

数码

教育要闻

旋转作图第1讲，一个视频学明白！

艺术要闻

你能在5秒内认出这18个字吗？看看专家怎么说！

手机要闻

三星S25+充电时爆炸家人送医！官方承认问题：用户不满赔偿

耳石脱落为何让人天旋地转+恶心？

数码要闻

2025年中国智能投影仪市场创史上最大下滑行业洗牌加速

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版