网易首页 > 网易号 > 正文 申请入驻

30万被引的AlphaGo之父,创业4个月融资近百亿元!笃信RL实现ASI

0
分享至


编辑:艾伦

AlphaGo 之父 David Silver 创办的 Ineffable Intelligence 获 11 亿美元种子轮,创欧洲融资纪录,估值达 51 亿美元。这家公司押注强化学习和自我经验学习,试图挑战依赖 Scaling Law 的大模型主线。

4 月 27 日,前谷歌 DeepMind 顶级研究员、UCL 教授 David Silver 创办的伦敦 AI 实验室 Ineffable Intelligence 宣布完成 11 亿美元种子轮融资,投后估值 51 亿美元。


https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

这是欧洲迄今最大规模种子轮。

Sequoia Capital 和 Lightspeed Venture Partners 共同领投,Nvidia、谷歌、Index、DST Global、英国 Sovereign AI Fund 等参与。

Ineffable 的目标是,做一个从自身经验中发现知识的「superlearner」,继续把强化学习推向 ASI。

这笔钱的特别之处在于阶段。

Ineffable 成立时间只有数月,公开产品、收入、路线图都还有限,但一上来就拿到 51 亿美元估值。

AI 投资已经进入一个新阶段,顶尖研究员的个人信用,正在替代传统意义上的商业验证,成为早期融资最稀缺的抵押物。

这笔巨款,投向了强化学习

过去三年,AI 行业的主线是大语言模型。

更大的语料、更大的集群、更强的推理,几乎构成了所有头部公司的共同剧本。

Silver 选择的是另一条路,强化学习。

强化学习的核心,是让模型在环境里行动,通过反馈修正策略。

围棋、国际象棋、星际争霸这些封闭系统,是它最早打出声量的地方。


游戏《星际争霸 2》

Silver 的新公司想把这套方法放大,让系统从基本动作技能一路学到科学、数学、技术层面的突破。

公司公开表述里,Ineffable 的使命是「与超级智能进行第一次接触」。

Silver 对大模型路线的分歧也在这里。

大语言模型主要从人类已经写下的文本和代码中学习,能力边界很大程度上受制于人类数据。

Silver 在接受 Wired 采访时把人类数据比作化石燃料,把自我学习比作可再生能源。

这个比喻也解释了为什么投资人愿意给一个没有完全展开商业模式的实验室开出巨额支票。

强化学习

是Scaling Law撞墙后的出路吗?

依赖海量人类数据的传统 Scaling Law 没有失效,但边际收益正在变差。

继续堆参数、堆语料、堆训练算力仍会带来提升,只是高质量人类文本正在变成瓶颈。

Epoch AI 估算,公开高质量人类文本的有效库存约为 300 万亿 Token,按趋势可能最早在今年,最晚在 2032 年,被彻底用光。


https://epoch.ai/blog/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data

也就是说,旧范式这条路还能走,但越来越贵、越来越慢。

纯强化学习确实提供了一条更接近 AGI / ASI 的路线,因为它让模型从「模仿人类文本」转向「通过行动和反馈获得经验」。

AlphaGo Zero 已经证明,在规则清晰、反馈明确的环境里,系统可以不依赖人类棋谱,通过自我对弈达到超人水平。

OpenAI o1 也显示,大规模强化学习和测试时更多思考时间,能显著增强复杂推理能力。

但纯强化学习短期很难单独承担 AGI 路线。

围棋、数学、代码这类任务有明确验证器,强化学习很强;

现实世界的问题没有稳定奖励函数,探索成本高,安全和对齐也更难。

谷歌 DeepMind 的 AlphaProof 更像是现实方向的样板,它结合预训练语言模型、Lean 形式化验证和 AlphaZero 式强化学习,在 IMO 上达到银牌水平。

所以更靠谱的判断是,未来不是大模型预训练和强化学习二选一,而是混合路线

预训练提供知识和语言底座,强化学习提供行动反馈和目标压力,搜索、验证器、工具调用、仿真环境提供可持续的新经验。

ASI 的关键,是让它能持续试错、验证、发现,并把经验重新变成能力。

大厂人,正在变成新的公司

Ineffable 赶上了一个窗口期。

OpenAI、DeepMind、Anthropic、xAI 等公司在上一轮 AI 竞赛中聚集了最稀缺的人才,也开始向创业市场外溢。

大模型公司继续用巨额算力和产品分发打仗,离开的人带着新路线、新组织和更高上行空间,去拿另一张桌子的筹码。

类似案例正在增多。

TechCrunch 提到,前 DeepMind 研究员 Tim Rocktäschel 创办的 Recursive Superintelligence 曾被报道融资需求可能上探 10 亿美元;


Yann LeCun 离开 Meta AI 负责人岗位后,其参与的 AMI Labs 在 3 月宣布 10.3 亿美元融资。


Ineffable 不是孤例,它是顶尖研究员创业潮里,金额最夸张的其中一笔。

这也解释了英国政府为何入场。

英国 Sovereign AI Fund 和 British Business Bank 参与了这轮融资,后者确认投资 2000 万美元,并称过去 12 个月已做出 9 笔 AI 投资,包括 Wayve、PolyAI 等公司。

对英国来说,DeepMind 被谷歌收购之后,伦敦长期拥有顶级 AI 人才密度,但缺少能留在本土、继续扩张的前沿实验室。

Ineffable 提供了一个重新下注的机会。

最大的问题,是从游戏走向世界

Ineffable 的技术叙事很干净,也有可见的风险。

围棋、象棋、星际争霸有规则、边界和可计算的反馈。

真实世界的科学发现、技术发明和社会系统,没有这么稳定的奖励函数。

一个智能体在模拟环境中学到的策略,如何迁移到开放世界,是强化学习走向通用智能绕不开的问题。

Silver 的答案仍然是模拟。

Wired 报道称,他希望把 Agent 放进模拟环境,让它们学习达成目标、相互协作,并观察它们如何对待其他智能体。

这种方法有一个优点,系统行为在更可控的空间里被观察;

也有一个难点,模拟世界必须足够丰富,才可能训练出对真实世界有用的能力。

安全问题也会随之被放大。

一个从经验中学习、持续寻找更优策略的系统,可能会发现人类没有预设过的路径。

强化学习的魅力正在这里,风险也正在这里。

投资人押注的,其实是 Silver 能不能把 AlphaGo 时代那套「从经验中学习」的方法,从游戏房间带到更大的世界。

David Silver 的第二次开局

David Silver 的履历是这个估值的最重要支柱。

UCL 官网资料显示,他曾任 DeepMind 强化学习研究组负责人,主导 AlphaGo,并参与 AlphaZero,后者通过自我对弈在围棋、国际象棋、日本将棋中达到超人类水平。

同时,他还通过国际象棋比赛认识了 DeepMind CEO Demis Hassabis,并成为终生好友。


即便离开了 DeepMind,二人仍保持亲密关系——David Silver 自述「离开只是因为想开辟一条全新的道路」。


https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

ACM 在 2020 年授予他 2019 ACM Prize in Computing,理由是其在计算机博弈上的突破性贡献。

英国皇家学会资料还列出,他参与过从 Atari、AlphaGo、AlphaZero 到 AlphaStar 的多项关键工作。

其谷歌学术主页及公开资料显示,Silver 的学术引用量已达 30 万,H-index 达到 103,是强化学习领域少数同时拥有学术影响力和产业战绩的人。


https://scholar.google.com/citations?user=-8DNE4UAAAAJ&hl=zh-CN&oi=ao

Ineffable 的 11 亿美元种子轮,表面是又一个 AI 融资纪录,核心是一次路线投票。

大模型仍在主赛道狂奔,Silver 试图证明,ASI 还可以从行动、反馈和自我经验里长出来。

过去,AlphaGo 让强化学习第一次走到大众面前;

现在,Ineffable 想让它从棋盘走向一整套新的智能系统。

参考资料:

https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

https://davidstarsilver.wordpress.com/

文章来源:新智元。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《妻子的浪漫旅行2026》孙杨回应与妻子张豆豆相处模式引争议:由于职业原因,像这样的旅行是第一次,看到了不足,有一个好老婆很重要

《妻子的浪漫旅行2026》孙杨回应与妻子张豆豆相处模式引争议:由于职业原因,像这样的旅行是第一次,看到了不足,有一个好老婆很重要

鲁中晨报
2026-04-28 09:53:07
城市迎来更新大潮!中央定调:20年房龄老房子,2026年起或又吃香

城市迎来更新大潮!中央定调:20年房龄老房子,2026年起或又吃香

石辰搞笑日常
2026-04-29 15:15:03
西方害怕中国治沙?《自然》新评揭开真相:他们怕的并非沙漠消失

西方害怕中国治沙?《自然》新评揭开真相:他们怕的并非沙漠消失

生活的哲学
2026-04-29 06:41:35
黄金暴跌!央行成本线4500,跌到就满仓!

黄金暴跌!央行成本线4500,跌到就满仓!

时尚的弄潮
2026-04-29 16:25:11
王楚钦霸气回应世乒赛:没人能“稳吃我们”,必定拿下冠军奖杯

王楚钦霸气回应世乒赛:没人能“稳吃我们”,必定拿下冠军奖杯

舟望停云
2026-04-29 17:06:01
流拍4次后,威马汽车子公司1.3亿元债权9.35万元成交,不保真、没合同、可能无法追回

流拍4次后,威马汽车子公司1.3亿元债权9.35万元成交,不保真、没合同、可能无法追回

红星资本局
2026-04-28 23:28:06
离婚后想找一个比前夫条件更好的为啥那么难 网友们是一片嘲笑声

离婚后想找一个比前夫条件更好的为啥那么难 网友们是一片嘲笑声

侃神评故事
2026-04-21 07:20:03
女人主动给你这3种“暗示”,不是喜欢你,是想“发生关系”...!

女人主动给你这3种“暗示”,不是喜欢你,是想“发生关系”...!

三农老历
2026-04-29 17:09:51
世界仅剩的两个殖民地:主国曾多次求它们独立,可人家愣是不答应

世界仅剩的两个殖民地:主国曾多次求它们独立,可人家愣是不答应

杰丝聊古今
2026-04-29 00:38:13
必须警惕!境外组织资助反华媒体炮制躺平洗脑论,侵蚀青年思想

必须警惕!境外组织资助反华媒体炮制躺平洗脑论,侵蚀青年思想

米果说识
2026-04-28 16:46:38
癌症 “源头” 已发现?油炸食品没上榜,第1名大家或天天都在吃

癌症 “源头” 已发现?油炸食品没上榜,第1名大家或天天都在吃

普陀动物世界
2026-04-29 16:33:09
在常州投资100万的东北铁锅炖,每天亏损,还要坚持吗

在常州投资100万的东北铁锅炖,每天亏损,还要坚持吗

别人都叫我阿腈
2026-04-29 14:57:20
正大量上市!硒是洋葱的30倍,中老年人多吃它,手脚灵活,精神棒

正大量上市!硒是洋葱的30倍,中老年人多吃它,手脚灵活,精神棒

阿龙美食记
2026-04-28 14:08:52
主角不止赵心童 22岁中国斯诺克小将吴宜泽创下个人最佳战绩

主角不止赵心童 22岁中国斯诺克小将吴宜泽创下个人最佳战绩

封面新闻
2026-04-29 09:20:06
陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

就一点
2026-04-29 17:28:35
小S回归脸上多2颗痣!网友疯猜原因 经纪人出面解答了

小S回归脸上多2颗痣!网友疯猜原因 经纪人出面解答了

ETtoday星光云
2026-04-29 17:28:08
济南的“格格”为何输给了宿迁的“哥哥”

济南的“格格”为何输给了宿迁的“哥哥”

评底郭
2026-04-29 15:11:05
究竟是哪些躺平网红接受境外组织资助了?建议严查严惩!

究竟是哪些躺平网红接受境外组织资助了?建议严查严惩!

灯锦年
2026-04-29 10:13:07
从奥运冠军到接受调查!张军,你怎么走到的这一步?

从奥运冠军到接受调查!张军,你怎么走到的这一步?

曹老师评球
2026-04-29 17:31:45
太心疼!马筱梅哭到停更带娃逃回台湾:凭啥让刚出生的孩子遭这罪

太心疼!马筱梅哭到停更带娃逃回台湾:凭啥让刚出生的孩子遭这罪

行者聊官
2026-04-28 09:42:56
2026-04-29 18:31:00
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5502文章数 64624关注度
往期回顾 全部

财经要闻

曾经的新能源首富,希望又破了!

头条要闻

俄首富超级游艇穿越霍尔木兹海峡:6层甲板 25米长泳池

头条要闻

俄首富超级游艇穿越霍尔木兹海峡:6层甲板 25米长泳池

体育要闻

一场九球狂欢,各路神仙批量下凡

娱乐要闻

马頔一句话,孙杨妈妈怒骂节目组2小时

科技要闻

今晨庭审纪实|马斯克当庭讲述OpenAI被偷走

汽车要闻

技术天花板再摸高 全能型的奕境X9首秀

态度原创

健康
教育
房产
数码
军事航空

干细胞治烧烫伤能用了么?

教育要闻

山东省家庭教育志愿服务总队走进东营市河口区巡讲活动圆满完成

房产要闻

80亿投资!浙商总部基地+海口北站,金沙湾这是要起飞啊!

数码要闻

威刚发布全新产品战略,公布ADATA NEXRA固态硬盘

军事要闻

美国参议院否决限制特朗普对古巴动武的决议

无障碍浏览 进入关怀版