网易首页 > 网易号 > 正文 申请入驻

吴恩达、Karpathy 天使轮,微软、SpaceX抢购,这家初创公司到底什么来头?

0
分享至


扩散模型杀进了文本生成的地盘,而巨头们为了抢它,已经打起来了。


作者|桦林舞王

编辑|靖宇

在 AI 疯狂发展的当下,在一片狂热之下,行业同样在担心一个根本问题——LLM 是否已经走到头了?会不会有新的架构诞生,造就出新的 AI 王者。

5 月 13 日,外媒爆出一条消息,微软正在和一家叫 Inception 的小公司谈收购。就在同一天,马斯克的 SpaceX,也在追求这家公司。

一家吴恩达、Karpathy 做天使投资人、种子轮才拿了 5000 万美元的创业公司,现在开价超过 10 亿美元——溢价 20 倍。微软和 SpaceX 两个万亿级巨头同时下场争抢,抢的不是什么成熟业务,是一支斯坦福教授团队和一条几乎没人走过的技术路线。

这家和诺兰的《盗梦空间》用一样名字的初创团队,到底有什么不同凡响之处?

01

三个教授和一个「异端」想法

Inception 的故事,要从它的创始人 Stefano Ermon 说起。

Ermon 是斯坦福大学计算机科学教授,但他更重要的身份是——扩散模型(Diffusion Model)的共同发明人。大家今天用的 Midjourney、Sora、Stable Diffusion,底层都跑着他帮助开创的技术。他关于文本扩散的论文拿过 ICML 2024 最佳论文奖。

2024 年中,Ermon 从斯坦福休假,拉上了两个合作超过 10 年的老搭档——UCLA 教授 Aditya Grover 和 Cornell 教授 Volodymyr Kuleshov,在 Palo Alto 创立了 Inception Labs。

这三个人有一个在当时看来相当「异端」的想法:把扩散模型从图像领域搬到文本生成领域,彻底替换掉自回归架构。

Andrej Karpathy 在 Inception 发布第一个模型时就在 X 上表达了兴趣。他说,今天几乎所有 LLM 在核心建模方法上都是「克隆体」,都是从左到右逐个预测 token。扩散模型完全不同——它不是从左到右生成,而是从噪声中逐步去噪,最终得到一个完整的 token 序列。他觉得这个模型「有潜力展现全新的、独特的能力特征」,鼓励大家去试。

Karpathy 不只是嘴上说说。他和吴恩达(Andrew Ng)都以天使投资人身份参与了 Inception 的种子轮。

2025 年 11 月,Inception 完成了 5000 万美元种子融资,Menlo Ventures 领投,NVIDIA 旗下 NVentures、微软旗下 M12、Snowflake Ventures、Databricks 投资部门全部跟投。

当 Karpathy 和吴恩达同时押注一家公司,当 NVIDIA 和微软的战投基金同时出现在投资人名单上,这基本上是 AI 领域最顶级的背书组合了。

02

快 10 倍,便宜 10 倍

要理解 Inception 为什么值钱,得先理解它的技术路线为什么不一样。

今天大家用的 ChatGPT、Claude、Gemini,底层全是自回归模型(Autoregressive Model)。它们生成文本的方式是:一个 token 接一个 token,从左到右,串行输出。每生成一个字之前,必须等前面所有字都生成完。

就像一个人写文章,只能一个字一个字地往后写,绝对不能跳着写。

这个方法很可靠,但有一个结构性天花板——速度被串行生成锁死了。你可以换更好的芯片,可以优化推理框架,可以压缩模型,但只要本质上还是逐 token 生成,速度就有上限。

Inception 选了一条完全不同的路。它用扩散模型做文本生成——不是逐字写,而是先给出一个「粗略草稿」,然后通过神经网络反复精炼,同时修改多个 token,并行输出。

Ermon 的原话很直白:「这是一种根本不同的方法。所有现有的大语言模型都是自回归的,一个接一个地从左到右生成文本或代码,这非常慢,因为你不能在生成前面所有内容之前生成后面的东西。」


Mercury 2 模型在每秒 token 输出上比流行的小模型更快|图片来源:Inception

实际效果呢?Inception 推出的模型家族叫 Mercury。2026 年 2 月发布的 Mercury 2,根据第三方评测机构 Artificial Analysis 的测试,输出吞吐量大约在每秒 1000 个 token。作为对比,Claude 4.5 Haiku 大约是每秒 89 个 token,GPT-5 Mini 大约是每秒 71 个 token。快了差不多 10 到 14 倍。

在质量上,Mercury 2 的 AIME 2025 得分 91.1,GPQA 得分 73.6,LiveCodeBench 得分 67.3。这些分数和 Claude 4.5 Haiku、GPT-5.2 Mini 在同一个竞争区间,但吞吐量是后者的 10 倍以上。

Ermon 对此也很坦诚——Mercury 2 对标的是 Haiku 和 Flash 这个级别的模型,不是 Claude Opus 或 GPT-4 这种旗舰。第三方分析也指出,在复杂推理任务上,扩散模型的质量大约是前沿自回归模型的 85%-95%,但在结构化输出和翻译任务上基本持平。

但这恰恰是它最有想象力的地方。如果扩散模型的质量差距只有 5%-15%,而速度优势是 10 倍,那在大量对延迟敏感的场景里——实时语音交互、代码自动补全、游戏对话、Agent 循环调用——扩散模型就是更实际的选择。


代码构建上 Mercury2 模型只用迭代 14 次,而其他模型要迭代 87 次|图片来源:Inception

而且,扩散框架还带来几个自回归模型做不到的结构性优势。

第一,输出可控性更强。扩散模型能天然遵循特定的 schema 和语义约束,生成符合指定格式的 JSON 输出,这在企业级应用里极其重要。

第二,天然支持多模态融合。扩散本来就是图像和视频生成的底层范式,现在把它扩展到文本,等于用一套统一框架处理语言、图像、音频、视频,不用再拼接不同架构。

第三,内置纠错能力。自回归模型一旦前面写错了,后面很难纠正;扩散模型可以在精炼过程中反复修正,理论上能减少幻觉。

当然,这条路线也有明显的不确定性。一些 AI 研究者指出,扩散方法让输出预测更加困难,它的 Scaling Law 还没有被充分验证——自回归模型「参数越多、数据越多、效果越好」的规律花了好几年才摸清,扩散模型是否遵循类似的规律,还是需要完全不同的优化策略,目前没有定论。

但正是这种不确定性,才让它有可能成为下一个范式。

03

「后 OpenAI 时代」的军备竞赛

理解了 Inception 的技术,再来看为什么微软和 SpaceX 同时抢它,逻辑就清楚了。

2026 年 4 月 27 日,微软和 OpenAI 官宣了合作关系的重大调整。微软对 OpenAI 模型的 IP 授权从独家变成非独家,有效期延到 2032 年。微软不再向 OpenAI 支付收入分成。OpenAI 可以在 AWS、Google Cloud 等任何云平台上提供服务。AGI 条款被彻底删除。

这段曾经被称为「科技界最佳 Bromance」的关系,实质上已经变成了「管理型竞争」。

微软在 OpenAI 身上花了超过 130 亿美元投资,还有大量 Azure 算力支持。但现在,OpenAI 不再是微软的「独家武器」,而微软也在加速摆脱对 OpenAI 的依赖。据报道,微软正在开发自己的通用 AI 模型,目标是 2027 年之前推出能和 OpenAI、Anthropic 正面竞争的前沿模型。

收购 AI 创业公司,就是这个战略的一部分。

路透社的报道披露,微软今年春天先看上了代码生成公司 Cursor,但因为自己有 GitHub Copilot,内部担心反垄断审查过不了,主动放弃了。SpaceX 随后立刻和 Cursor 签了一份 600 亿美元的收购期权协议——如果收购不成,SpaceX 也要付 100 亿美元的合作费。

微软放弃 Cursor 后,转向了 Inception。但 SpaceX 也盯上了 Inception。Inception 已经聘请了投行来操盘交易谈判,开价超过 10 亿美元。

SpaceX 的介入让整件事更有趣。

2026 年 2 月,SpaceX 以全股票交易方式收购了 Musk 的 xAI,两家公司合并后估值 1.25 万亿美元。这是有史以来估值最高的商业并购。SpaceX 随后又启动了 Terafab 半导体工厂项目,与 Tesla 和 xAI 联合建设。再加上收购 Cursor 的期权和对 Inception 的追求,Musk 显然在用 SpaceX 作为平台,系统性地构建一个从芯片到模型到应用的完整 AI 技术栈。

而微软这边,除了追求 Inception 之外,也在同时和多家 AI 创业公司接触。路透社引述知情人士称,AI 研究人员现在轻松就能拿到数千万美元的薪酬,创业公司估值在投资者的疯抢下飞速上涨。

Menlo Ventures 合伙人 Tim Tully 在 Inception 融资时说过一句话,放在今天的收购大战背景下格外应景。他说,Inception 的团队证明了扩散式 LLM 不只是一个研究突破,而是「一个可以构建可扩展、高性能语言模型的基础,企业今天就能部署」。

这句话解释了一切——巨头们抢的不是一家公司,是一个可能改写游戏规则的技术范式,以及掌握这个范式的那几个人。

当微软和 OpenAI 的「婚姻」走向开放式关系,当 SpaceX 从火箭公司变成 AI 收购机器,当一家种子轮公司被两个万亿巨头同时争抢——这场「后 OpenAI 时代」的军备竞赛,才刚刚开始。

而 Inception 的命运,无论最终花落谁家,都已经证明了一件事:在 AI 的世界里,真正稀缺的从来不是资本,而是敢走不同路线的人。

*头图来源:豆瓣电影

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你觉得扩散模型有可能取代自回归,

成为下一代 AI 的底层范式吗?


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
遭多次争议改判!王欣瑜1-2生涯首输科尔帕奇 止步法网次轮

遭多次争议改判!王欣瑜1-2生涯首输科尔帕奇 止步法网次轮

醉卧浮生
2026-05-27 19:39:37
泽连斯基笑不出来了!普京用水泥弹头,直接炸平了基辅司令部!

泽连斯基笑不出来了!普京用水泥弹头,直接炸平了基辅司令部!

潋滟晴方DAY
2026-05-27 11:07:00
30万顶大盖帽一夜清零!307亿退回,地方财路断了

30万顶大盖帽一夜清零!307亿退回,地方财路断了

奇葩游戏酱
2026-05-27 11:16:09
刘强东最新讲话:想尽一切办法保住数十万员工的饭碗,承诺“被机器人取代的一线员工,一个都不开除”

刘强东最新讲话:想尽一切办法保住数十万员工的饭碗,承诺“被机器人取代的一线员工,一个都不开除”

极目新闻
2026-05-27 18:54:57
国足26人名单将公布!海港2老将回归 3大U23核心入选 李昊或首秀

国足26人名单将公布!海港2老将回归 3大U23核心入选 李昊或首秀

我爱英超
2026-05-27 16:54:09
洗厕所6年,洗碗6年,3次濒临破产:黄仁勋的“活下去”哲学,打脸多少眼高手低的人?

洗厕所6年,洗碗6年,3次濒临破产:黄仁勋的“活下去”哲学,打脸多少眼高手低的人?

苏格拉高
2026-05-27 08:13:34
地下助孕实验室藏身杭州别墅区 记者暗访遭工作人员暴力拖拽致骨折

地下助孕实验室藏身杭州别墅区 记者暗访遭工作人员暴力拖拽致骨折

大象新闻
2026-05-27 18:28:16
我定居泰国15年,娶过3个妻子,发现泰国的女人都有一个共同特点

我定居泰国15年,娶过3个妻子,发现泰国的女人都有一个共同特点

千秋文化
2026-05-26 19:45:23
罕见,海港宽宏大量未申诉!评议组回应天津津门虎:漏点+假摔

罕见,海港宽宏大量未申诉!评议组回应天津津门虎:漏点+假摔

足球大腕
2026-05-27 20:07:05
44岁LV太子妃官宣怀六胎!俄罗斯超模捧孕肚出镜,胳膊腿仍纤细

44岁LV太子妃官宣怀六胎!俄罗斯超模捧孕肚出镜,胳膊腿仍纤细

译言
2026-05-27 07:10:38
1分钟搞懂各种咖啡,点单不踩雷

1分钟搞懂各种咖啡,点单不踩雷

混知
2026-05-26 16:20:33
伊美谅解备忘录初步非正式文件内容披露

伊美谅解备忘录初步非正式文件内容披露

新华社
2026-05-27 20:08:05
爆了!普京发出警告所有大使馆撤离,欧盟决不后退,美国打破僵局

爆了!普京发出警告所有大使馆撤离,欧盟决不后退,美国打破僵局

风雨与阳光
2026-05-27 02:22:22
四十年最大之谜:包产到户后农民马上吃饱饭,是真的吗?

四十年最大之谜:包产到户后农民马上吃饱饭,是真的吗?

鉴史录
2026-05-27 14:33:30
A股:大盘精准跌到4093.73点,不出意外的话,明天行情这么走!

A股:大盘精准跌到4093.73点,不出意外的话,明天行情这么走!

夜深爱杂谈
2026-05-27 20:04:21
行进中国丨老城向上 “天台经济”点亮古城夜色

行进中国丨老城向上 “天台经济”点亮古城夜色

人民资讯
2026-05-27 09:49:52
金小刀或入狱?不到24小时,萧旭岑抵达大陆,对民进党喊出四个字

金小刀或入狱?不到24小时,萧旭岑抵达大陆,对民进党喊出四个字

云舟史策
2026-05-27 07:19:02
网吧老板当场赶人:这台机器以后别想打这游戏了

网吧老板当场赶人:这台机器以后别想打这游戏了

峡谷一级保护废物
2026-05-27 10:20:52
湖南明确:一律先免职再彻查

湖南明确:一律先免职再彻查

第一财经资讯
2026-05-27 11:08:08
铁公鸡拔毛?俄罗斯松口转让中国卡-226T整条生产线,算盘打得精

铁公鸡拔毛?俄罗斯松口转让中国卡-226T整条生产线,算盘打得精

步论天下事
2026-05-27 09:40:08
2026-05-27 22:03:00
极客公园
极客公园
让最棒的创新成为头条
12091文章数 78885关注度
往期回顾 全部

财经要闻

中国半导体的阳谋

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

手机
艺术
数码
本地
军事航空

手机要闻

华为余承东:全新问界M9系列1小时大定突破11000台

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

数码要闻

洗地机还卷吸力?添可芙万极客蒸汽2.0狠多了

本地新闻

用剪纸的方式,打开江苏扬州

军事要闻

以军称已打死哈马斯新任军事领导人

无障碍浏览 进入关怀版