网易首页 > 网易号 > 正文 申请入驻

狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投

0
分享至

新智元报道

编辑:Aeneas 好困

【新智元导读】打造出AlphaGo的超级天才、谷歌DeepMind十二年老将Ioannis Antonoglou下场创业了,初创Reflection已融资1.3亿,种子轮由红杉资本等领投。他和Gemini的核心贡献者携手,目标是用强化学习造出真·超级AI。

近日,由DeepMind近12年老将、做出AlphaGo/AlphaZero/MuZero等项目的超级天才Ioannis Antonoglou,和Gemini强化学习的核心负责人Misha Laskin,联合成立的初创Reflection AI终于浮出了水面。

Reflection AI的目标十分明确——构建超级智能自主系统

首先,从自主编码开始。

目前,这家初创已经融资了1.3亿,投资方有红杉资本、 Lightspeed和CRV。

如此野心的背后,是堪称豪华的团队阵容。

过去的十年间,团队成员在RL和LLM领域均取得了重大突破,并为DeepMind、OpenAI等前沿AI实验室主导构建了当时最为强大的AI系统——

那么,究竟该如何构建超级智能?

这就涉及到了这样一个问题:究竟如何让LLM在计算机上展现出与AlphaGo在围棋上同等水平到自主能力?

对此,Reflection的策略是,通过RL提高LLM的自主能力。

他们相信,解决自主编码是一个根节点问题——如果能构建一个超级智能的自主编码系统,所有其他基于计算机的工作领域都将自然而然地解决。

DeepMind顶级研究员出走创业,估值5.55亿美金

此前,这家名为Reflection AI的初创公司一直很低调。

就在刚刚,它宣布了全新融资:由红杉资本和CRV领投的2500万美元种子轮融资,以及由Lightspeed Venture Partners和CRV领投的1.05亿美元A轮融资。

而其他投资者,包括LinkedIn联合创始人Reid Hoffman、Scale AI首席执行官Alexandr Wang、SV Angel和英伟达的风投部门。

现在,Reflection AI的最新估值已经达到5.55亿美元。

如今,已经有越来越多的科技公司押注于所谓的AI智能体,,就反映了人们对这种帮用户执行任务的AI的渴望。

但Reflection却有着更为宏大使命:构建具有完全自主性的工具,而不仅仅一种协作工具或助手。

在他们看来,这种方法将更快地实现「超级人工智能」——也就是比大多数人更聪明、范围更广的AI。

许多大公司,比如OpenAI、Anthropic和DeepMind,都有着类似的目标。

现在,Relection已经在拥有大型编码团队的领域(如金融服务和技术行业)有付费客户了。这家公司专注于自动化繁琐和机械的工程工作,比如迁移软件数据库或重构代码。

Lightspeed合伙人Raviraj Jain将在Reflection的董事会中任职,他表示,公司要做的事并不是取代工程师。而是让工程师不再做繁重的工作,而是成为像建筑师一样的角色,来监督大量的自主AI智能体。

如今,AI编程领域已经涌入了一大批资金充足的初创公司,而Cursor制造商Anysphere、Replit和Poolside,都在此领域颇为出名。

在Laskin看来,一般的AI助手就像定速巡航,而Reflection则致力于成为更像Waymo那样的存在。

而红杉资本合伙人Stephanie Zhan,也十分看好Relection。

在他看来,Reflection有潜力与从事类似工作的大型AI实验室竞争并胜出,因为世界在短短几年内就会变得非常不同,AI完全能自动化今天我们做的许多任务。

剑指「超级智能」

在官方博客中,Relection联创Ioannis回顾了十年前,自己作为创始工程师加入了DeepMind的经历。

那时,他创造了AlphaGo,第一个在围棋游戏中超越人类世界冠军的系统。

2016年的那一刻,是AI的转折点,也对Reflection团队的许多成员产生了深远影响——他们第一次真正领悟到,超级智能的真实形态是什么样子。

多年来,他们一直孜孜以求地构建超级智能。

Reflection将其视为一个能在计算机上完成大部分认知工作的自主系统。

它不仅能帮助自动化现有的工作,还能发现我们未曾考虑过的更好的解决方案,就像AlphaGo在围棋中发现了新策略,扩展了人类知识,让著名的第37手棋成为了传奇。

Reflection相信,解决自主编码问题将更广泛地实现超级智能。

构建完全自主编码系统所需的突破——如高级推理和迭代自我改进——会自然延伸到更广泛的计算机工作类别。

一旦复杂软件可以被自动规划、编写和完善,类似的能力就会无缝转移到其他计算机驱动的任务上,加速向AGI的进展。

多年来,如何构建这样一个系统并不明确。

然而,在过去十年中,Reflection团队在RL和LLM方面开创了重大进步,他们相信,这些是超级智能的基本构建模块。

从2013年到2020年,团队用RL创建了专用超级智能系统,如Deep Q Networks、AlphaGo、AlphaZero和MuZero。

从2020年到2024年,他们以LLM的形式开发了通用智能系统,如PaLM、CharacterAI、ChatGPT和Gemini,领导了这些AI的预训练和后训练。

正是突破,指导了他们实现通用人工智能的策略:通过强化学习扩展大语言模型的自主能力。

作为一家公司,Reflection共同的核心信念是,最重要的评估是实际应用评估。

开创性的AI不是在真空中发展的;它需要研发与产品的协同设计。自主能力必须在真实场景中展示切实价值。

通过与用户反馈一起迭代,他们确保这些系统不仅可靠地满足实际需求,还有助于塑造负责任设计的AI的未来。

目前,他们的重点是一个自主编码系统:一个实用的产品,同时也代表着向我们超级智能目标迈出的重要一步。

他们有一个简单的两步计划:

  1. 构建一个超级智能的自主编码系统

  2. 使用这一蓝图扩展到所有其他基于计算机的工作类别

如今,Reflection已经组建了一个世界级的团队。

创始团队

Misha Laskin:联合创始人兼CEO

Misha Laskin于2022年加入DeepMind担任研究科学家,负责谷歌关键LLM项目Gemini的RLHF和奖励模型团队。

他见证了初代Gemini和Gemini 1.5的诞生。

他的研究兴趣是「强化学习如何为LLM和多模态模型解锁新能力」,并致力于开发通用AI智能体。

此前,他在耶鲁大学获得学士学位,在芝加哥大学获得理论物理学博士学位,并在加州大学伯克利分校BAIR实验室进行AI领域的博士后研究,主攻深度强化学习和无监督学习。

2017年,他曾共同创办了一家专注于为零售商预测产品需求的AI公司,并从BCC、Y Combinator和Salesforce Ventures获得175万美元风险投资。

而他也藉此被福布斯评为「30 Under 30」零售和电子商务领域的杰出人物。

Ioannis Antonoglou:联合创始人兼CTO

近12年的老将Ioannis Antonoglou,不仅是DeepMind的创始工程师,而且也是Gemini的第四位核心开发者。

此前,他在亚里士多德大学获得电气和计算机工程学士和硕士学位,并在爱丁堡大学AI和机器学习硕士学位。

值得一提的是,他在DeepMind期间还获得了伦敦大学学院AI博士学位。

超级智能是未来

Ilya曾在NeurIPS 2024上表示,超级智能(superintelligence)是公认的发展方向,也是研究人员们正在构建的东西。

从本质上来说,超级智能与现在的AI完全不同。

目前,我们拥有出色的LLM和聊天机器人,但它们也表现出某些奇怪的不可靠性——时常会感到困惑,但却能在评估中表现出远超人类的能力。

虽然我们还不知道如何调和这一点,但最终迟早会实现以下目标:AI将真正具备实际意义上的智能体特性,并将正学会推理。

由于推理会引入了更多的复杂性,因此一个会推理的系统,推理量越多,就会变得越不可预测。

相比之下,我们熟知的深度学习都是可以预测的。

举个例子,那些优秀的国际象棋AI,对于最顶尖的人类棋手来说就是不可预测的。

所以,我们将来不得不面对的,是一些极其不可预测的AI系统——它们能够从有限的数据中理解事物,同时也不会感到困惑。

同样,自我意识也是有用的,它构成了我们自身的一部分,同时也是我们世界模型中的一部分。

当所有这些特性与自我意识结合在一起时,就会带来与现有系统完全不同性质和特性的系统,它们将拥有令人难以置信的惊人能力。

虽然无法确定如何实现、何时实现,但这终将发生。

参考资料:

https://www.reflection.ai/superintelligence/

https://www.bloomberg.com/news/articles/2025-03-07/ex-deepmind-researchers-new-startup-aims-for-superintelligence

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普彻底懵了,海湾国家突然变脸,反对停战,美媒:美国被骗了

特朗普彻底懵了,海湾国家突然变脸,反对停战,美媒:美国被骗了

Ck的蜜糖
2026-03-27 00:20:33
乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

我心纵横天地间
2026-01-22 18:41:25
随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

薇说体育
2026-03-26 10:48:02
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

黄河新闻网吕梁
2026-03-26 15:14:06
女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

游民星空
2026-03-25 20:08:13
曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

古希腊掌管松饼的神
2026-03-25 12:00:46
中国禁止AI公司Manus两名高管离境?外交部回应

中国禁止AI公司Manus两名高管离境?外交部回应

澎湃新闻
2026-03-26 15:36:31
《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

上官晚安
2026-03-26 06:48:44
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

萌城少年强
2026-01-22 12:47:40
沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

素衣读史
2026-03-25 21:26:46
轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

李喜林篮球绝杀
2026-03-26 11:34:01
巴萨真会看人:从“天才摇篮”到“板凳深渊”,五名球员迷失报告

巴萨真会看人:从“天才摇篮”到“板凳深渊”,五名球员迷失报告

C罗带你侃球
2026-03-25 20:29:45
人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

复转这些年
2026-03-25 10:02:32
44岁柳岩一袭蓝裙封神,这若隐若现的腰臀比,谁看了不迷糊?

44岁柳岩一袭蓝裙封神,这若隐若现的腰臀比,谁看了不迷糊?

娱乐领航家
2026-03-26 22:00:03
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

爱范儿
2026-03-26 15:27:20
刚刚!诞生了!CBA第一支季后赛球队...

刚刚!诞生了!CBA第一支季后赛球队...

技巧君侃球
2026-03-26 23:58:26
央媒发话,房子是最大资产,2026房地产要下猛药了?

央媒发话,房子是最大资产,2026房地产要下猛药了?

毒sir财经
2026-03-24 23:51:50
马英九专访中途喊停,原因曝光

马英九专访中途喊停,原因曝光

郭茂辰海峡传真
2026-03-26 21:32:49
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
2026-03-27 01:32:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
旅游
手机
家居
教育

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

家居要闻

傍海而居 静观蝴蝶海

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

无障碍浏览 进入关怀版