网易首页 > 网易号 > 正文 申请入驻

30万被引的AlphaGo之父,创业4个月融资近百亿元!笃信RL实现ASI

0
分享至


新智元报道

编辑:艾伦

【新智元导读】AlphaGo 之父 David Silver 创办的 Ineffable Intelligence 获 11 亿美元种子轮,创欧洲融资纪录,估值达 51 亿美元。这家公司押注强化学习和自我经验学习,试图挑战依赖 Scaling Law 的大模型主线。

4 月 27 日,前谷歌 DeepMind 顶级研究员、UCL 教授 David Silver 创办的伦敦 AI 实验室 Ineffable Intelligence 宣布完成 11 亿美元种子轮融资,投后估值 51 亿美元。


https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

这是欧洲迄今最大规模种子轮。

Sequoia Capital 和 Lightspeed Venture Partners 共同领投,Nvidia、谷歌、Index、DST Global、英国 Sovereign AI Fund 等参与。

Ineffable 的目标是,做一个从自身经验中发现知识的「superlearner」,继续把强化学习推向 ASI。

这笔钱的特别之处在于阶段。

Ineffable 成立时间只有数月,公开产品、收入、路线图都还有限,但一上来就拿到 51 亿美元估值。

AI 投资已经进入一个新阶段,顶尖研究员的个人信用,正在替代传统意义上的商业验证,成为早期融资最稀缺的抵押物。

这笔巨款,投向了强化学习

过去三年,AI 行业的主线是大语言模型。

更大的语料、更大的集群、更强的推理,几乎构成了所有头部公司的共同剧本。

Silver 选择的是另一条路,强化学习。

强化学习的核心,是让模型在环境里行动,通过反馈修正策略。

围棋、国际象棋、星际争霸这些封闭系统,是它最早打出声量的地方。


游戏《星际争霸 2》

Silver 的新公司想把这套方法放大,让系统从基本动作技能一路学到科学、数学、技术层面的突破。

公司公开表述里,Ineffable 的使命是「与超级智能进行第一次接触」。

Silver 对大模型路线的分歧也在这里。

大语言模型主要从人类已经写下的文本和代码中学习,能力边界很大程度上受制于人类数据。

Silver 在接受 Wired 采访时把人类数据比作化石燃料,把自我学习比作可再生能源。

这个比喻也解释了为什么投资人愿意给一个没有完全展开商业模式的实验室开出巨额支票。

强化学习

是Scaling Law撞墙后的出路吗?

依赖海量人类数据的传统 Scaling Law 没有失效,但边际收益正在变差。

继续堆参数、堆语料、堆训练算力仍会带来提升,只是高质量人类文本正在变成瓶颈。

Epoch AI 估算,公开高质量人类文本的有效库存约为 300 万亿 Token,按趋势可能最早在今年,最晚在 2032 年,被彻底用光。


https://epoch.ai/blog/will-we-run-out-of-data-limits-of-llm-scaling-based-on-human-generated-data

也就是说,旧范式这条路还能走,但越来越贵、越来越慢。

纯强化学习确实提供了一条更接近 AGI / ASI 的路线,因为它让模型从「模仿人类文本」转向「通过行动和反馈获得经验」。

AlphaGo Zero 已经证明,在规则清晰、反馈明确的环境里,系统可以不依赖人类棋谱,通过自我对弈达到超人水平。

OpenAI o1 也显示,大规模强化学习和测试时更多思考时间,能显著增强复杂推理能力。

但纯强化学习短期很难单独承担 AGI 路线。

围棋、数学、代码这类任务有明确验证器,强化学习很强;

现实世界的问题没有稳定奖励函数,探索成本高,安全和对齐也更难。

谷歌 DeepMind 的 AlphaProof 更像是现实方向的样板,它结合预训练语言模型、Lean 形式化验证和 AlphaZero 式强化学习,在 IMO 上达到银牌水平。

所以更靠谱的判断是,未来不是大模型预训练和强化学习二选一,而是混合路线

预训练提供知识和语言底座,强化学习提供行动反馈和目标压力,搜索、验证器、工具调用、仿真环境提供可持续的新经验。

ASI 的关键,是让它能持续试错、验证、发现,并把经验重新变成能力。

大厂人,正在变成新的公司

Ineffable 赶上了一个窗口期。

OpenAI、DeepMind、Anthropic、xAI 等公司在上一轮 AI 竞赛中聚集了最稀缺的人才,也开始向创业市场外溢。

大模型公司继续用巨额算力和产品分发打仗,离开的人带着新路线、新组织和更高上行空间,去拿另一张桌子的筹码。

类似案例正在增多。

TechCrunch 提到,前 DeepMind 研究员 Tim Rocktäschel 创办的 Recursive Superintelligence 曾被报道融资需求可能上探 10 亿美元;


Yann LeCun 离开 Meta AI 负责人岗位后,其参与的 AMI Labs 在 3 月宣布 10.3 亿美元融资。


Ineffable 不是孤例,它是顶尖研究员创业潮里,金额最夸张的其中一笔。

这也解释了英国政府为何入场。

英国 Sovereign AI Fund 和 British Business Bank 参与了这轮融资,后者确认投资 2000 万美元,并称过去 12 个月已做出 9 笔 AI 投资,包括 Wayve、PolyAI 等公司。

对英国来说,DeepMind 被谷歌收购之后,伦敦长期拥有顶级 AI 人才密度,但缺少能留在本土、继续扩张的前沿实验室。

Ineffable 提供了一个重新下注的机会。

最大的问题,是从游戏走向世界

Ineffable 的技术叙事很干净,也有可见的风险。

围棋、象棋、星际争霸有规则、边界和可计算的反馈。

真实世界的科学发现、技术发明和社会系统,没有这么稳定的奖励函数。

一个智能体在模拟环境中学到的策略,如何迁移到开放世界,是强化学习走向通用智能绕不开的问题。

Silver 的答案仍然是模拟。

Wired 报道称,他希望把 Agent 放进模拟环境,让它们学习达成目标、相互协作,并观察它们如何对待其他智能体。

这种方法有一个优点,系统行为在更可控的空间里被观察;

也有一个难点,模拟世界必须足够丰富,才可能训练出对真实世界有用的能力。

安全问题也会随之被放大。

一个从经验中学习、持续寻找更优策略的系统,可能会发现人类没有预设过的路径。

强化学习的魅力正在这里,风险也正在这里。

投资人押注的,其实是 Silver 能不能把 AlphaGo 时代那套「从经验中学习」的方法,从游戏房间带到更大的世界。

David Silver 的第二次开局

David Silver 的履历是这个估值的最重要支柱。

UCL 官网资料显示,他曾任 DeepMind 强化学习研究组负责人,主导 AlphaGo,并参与 AlphaZero,后者通过自我对弈在围棋、国际象棋、日本将棋中达到超人类水平。

同时,他还通过国际象棋比赛认识了 DeepMind CEO Demis Hassabis,并成为终生好友。


即便离开了 DeepMind,二人仍保持亲密关系——David Silver 自述「离开只是因为想开辟一条全新的道路」。


https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

ACM 在 2020 年授予他 2019 ACM Prize in Computing,理由是其在计算机博弈上的突破性贡献。

英国皇家学会资料还列出,他参与过从 Atari、AlphaGo、AlphaZero 到 AlphaStar 的多项关键工作。

其谷歌学术主页及公开资料显示,Silver 的学术引用量已达 30 万,H-index 达到 103,是强化学习领域少数同时拥有学术影响力和产业战绩的人。


https://scholar.google.com/citations?user=-8DNE4UAAAAJ&hl=zh-CN&oi=ao

Ineffable 的 11 亿美元种子轮,表面是又一个 AI 融资纪录,核心是一次路线投票。

大模型仍在主赛道狂奔,Silver 试图证明,ASI 还可以从行动、反馈和自我经验里长出来。

过去,AlphaGo 让强化学习第一次走到大众面前;

现在,Ineffable 想让它从棋盘走向一整套新的智能系统。

参考资料:

https://www.cnbc.com/2026/04/27/deepmind-ineffable-intelligence-record-seed-funding-nvidia-google.html

https://www.wired.com/story/david-silver-ai-ineffable-intelligence-reinforcement-learning/

https://davidstarsilver.wordpress.com/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国防部长被炸身亡!俄罗斯外交重大损失,关键时刻雪上加霜

国防部长被炸身亡!俄罗斯外交重大损失,关键时刻雪上加霜

花间悦语
2026-04-27 17:58:47
徐巧芯突抛8千亿,韩国瑜吓傻,傅崐萁暴怒,郑丽文重镑炸出

徐巧芯突抛8千亿,韩国瑜吓傻,傅崐萁暴怒,郑丽文重镑炸出

陈博世财经
2026-04-28 14:16:26
NBA罚单:斯马特质疑裁判公正性罚3.5万 肯纳德不当言论罚2.5万

NBA罚单:斯马特质疑裁判公正性罚3.5万 肯纳德不当言论罚2.5万

醉卧浮生
2026-04-28 10:04:51
火箭队该逢高出货?专家建议:今夏应交易杜兰特!22队都对其有意

火箭队该逢高出货?专家建议:今夏应交易杜兰特!22队都对其有意

熊哥爱篮球
2026-04-28 19:22:17
生涯三双总数达到221次!约基奇追平威少并列NBA历史第一

生涯三双总数达到221次!约基奇追平威少并列NBA历史第一

北青网-北京青年报
2026-04-28 19:18:39
今夏“赫本衫”太火了,洋气好看,巨巨巨显瘦!

今夏“赫本衫”太火了,洋气好看,巨巨巨显瘦!

脆皮先生
2026-04-27 19:50:15
震惊!惠州32岁独女网征上门女婿,一句“入赘我家享荣华”引热议

震惊!惠州32岁独女网征上门女婿,一句“入赘我家享荣华”引热议

火山詩话
2026-04-27 11:46:05
未来两个月,蛰伏已久,终于等来翻身机会的三个星座,否极泰来

未来两个月,蛰伏已久,终于等来翻身机会的三个星座,否极泰来

小晴星座说
2026-04-28 19:17:57
26款问界M9对比25款,多5个激光雷达,贵了3万?

26款问界M9对比25款,多5个激光雷达,贵了3万?

选车侦探
2026-04-28 18:31:18
谁也没想到!中信证券突然迎来大佬入局

谁也没想到!中信证券突然迎来大佬入局

中访网
2026-04-28 09:48:24
河南媳妇晒婆婆做的早餐,朋友圈火了,网友:家里有矿!吃不起!

河南媳妇晒婆婆做的早餐,朋友圈火了,网友:家里有矿!吃不起!

白话电影院
2026-04-02 13:16:34
血亏12亿!华晨宇直播失控大哭,云南拿地建乐园,临门一脚被叫停

血亏12亿!华晨宇直播失控大哭,云南拿地建乐园,临门一脚被叫停

科学发掘
2026-04-27 12:19:09
五万户股东踩雷!002779、603360,被立案后双双“一字”跌停

五万户股东踩雷!002779、603360,被立案后双双“一字”跌停

大众证券报
2026-04-28 19:27:08
美伊大战暴露了中国家底,美国这才明白,为啥中国人底气能这么足

美伊大战暴露了中国家底,美国这才明白,为啥中国人底气能这么足

触摸史迹
2026-04-28 15:13:05
宋承炫宣布当爸!为爱隐退后定居美国,与圈外妻子迎来爱情结晶

宋承炫宣布当爸!为爱隐退后定居美国,与圈外妻子迎来爱情结晶

奇怪的鲨鱼们
2026-04-22 12:50:18
纽约期金失守4580美元/盎司,日内跌2.42%

纽约期金失守4580美元/盎司,日内跌2.42%

每日经济新闻
2026-04-28 19:57:15
黄国昌主动提公布新北“蓝白合”民调数字,国民党高层还问“确定吗?”

黄国昌主动提公布新北“蓝白合”民调数字,国民党高层还问“确定吗?”

海峡导报社
2026-04-28 16:04:03
外媒:伊朗储油能力即将耗尽,石油生产或遭不可逆损害

外媒:伊朗储油能力即将耗尽,石油生产或遭不可逆损害

中国能源网
2026-04-28 18:45:26
午后突变!300540,直线20%涨停!工业气体爆发

午后突变!300540,直线20%涨停!工业气体爆发

证券时报e公司
2026-04-28 15:43:32
物业费收不上来,一年超200个小区遭物业“撤场”

物业费收不上来,一年超200个小区遭物业“撤场”

第一财经资讯
2026-04-28 17:35:14
2026-04-28 21:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15086文章数 66818关注度
往期回顾 全部

财经要闻

政治局会议:加强算力网等规划建设

头条要闻

80多万买的新房未交房成工人宿舍 业主看到排泄物崩溃

头条要闻

80多万买的新房未交房成工人宿舍 业主看到排泄物崩溃

体育要闻

季后赛最新局势:雷霆4-0晋级首队 4队3-1

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

游戏
本地
亲子
时尚
公开课

国产大作联动肯德基!全新联名套餐+定制道具

本地新闻

用青花瓷的方式,打开西溪湿地

亲子要闻

拍了几年的急救视频,模特小朋友长大了!拍到异物卡喉气道梗阻的急救方法更新了,气道完全梗阻五次拍背+五...

她们的人生牛仔裤,链接都在这了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版