网易首页 > 网易号 > 正文 申请入驻

Ilya向全世界宣布:预训练结束了!全球AI数据耗尽,超级智能才是未来

0
分享至


新智元报道

编辑:Aeneas 好困

【新智元导读】全球顶会NeurIPS 2024中,Ilya登场演讲,向全世界宣告:预训练结束了!数据如同化石燃料般难以再生,未来,AI的发展方向就是具备自我意识的超级智能。

刚刚,Ilya现身NeurIPS 2024,宣布:预训练从此将彻底终结。

短短16分钟的发言,足以震撼全场。

是的,他的原话是——

正如我们所知的那样,预训练毫无疑问将会终结,与此同时我们也不会再有更多数据了。

原因在于,我们只有一个互联网,训练模型需要的海量数据即将枯竭,唯有从现有数据中寻找新的突破,AI才会继续发展。

Ilya的预测是,以后的突破点,就在于智能体、合成数据和推理时计算。


未来,我们会走向何方?

Ilya告诉我们:接下来登场的就是超级智能(superintelligence)——智能体,推理,理解和自我意识。


十年再登巅峰,Ilya感谢前同事


论文地址:https://arxiv.org/abs/1409.3215

Ilya感谢了自己的两位合著者Oriel Vinyals和Kwok-Lee,放出了下面这张图。


这是在十年前,2014年蒙特利尔NeurIPS 会议上一次类似演讲的截图。Ilya说,那是一个更加纯粹的时代。

而如今,图中的三位青葱少年已经长成了下面的模样。


Ilya要做的第一件事,是展示10年前同一个演讲的PPT。

他们的工作,可以用以下三个要点概括——

这是一个基于文本训练的自回归模型;它是一个大型神经网络;它使用了一个大规模的数据集。


10层神经网络,只需几分之一秒

下面,Ilya与我们探讨了「深度学习假设」。

如果你有一个10层的大型神经网络,它就可以在几分之一秒内,完成任何人类能做的事。

为什么要强调几分之一秒内?

如果你相信深度学习的基本假设,即人工神经元和生物神经元是相似的,并且你也相信真实神经元的速度比人类快速完成任务的速度更慢,那么只要全世界有一个人能够在不到一秒内完成某项任务,那么一个10层神经网络也能做到。

只要把它们的连接,嵌入到你的人工神经网络中。

这就是我们的动机。

我们专注于10层神经网络,因为在那个时候,这就是我们能够训练的神经网络。如果你能突破10层,你当然可以完成更多事。


下面这张PPT,描述的是他们的「主要想法」。

核心观点就是,如果你有一个自回归模型,并且它能够足够好地预测下一个Token,那么它实际上会抓取、捕获、掌握接下来任何序列的真实分布。

在当时,这是一个相对新颖的观点。

尽管它并不是第一个被应用于实践的自回归神经网络,但Ilya认为,这是第一个令他们深信不疑的自回归网络:如果把它训练得足够好,那么你就会得到想要的任何结果。

当时,他们尝试的是翻译。这个任务如今看来平凡无奇,当时却极具挑战性。


接下来,Ilya展示了一些可能很多人从未见过的古老历史——LSTM。

不熟悉的人会觉得,LSTM是Transformer出现之前,深度学习研究者所使用的工具。它可以被看作是一个旋转了90度的ResNet,但更复杂一些。

我们可以看到积分器(integrator),如今被称为残差流(residual stream),还涉及一些更为复杂的乘法操作。


Ilya还想强调的一点是,他们当时使用了并行化。

不过并不是普通的并行化,而是流水线并行化(pipelining),每层神经网络都分配一块GPU。

从今天来看,这个策略并不明智,但当时的他们并不知道。于是,他们使用8块GPU,实现了3.5倍的速度。


从这里,Scaling Law开始了

最终,ILya放出了那次演讲中最为意义重大的一张PPT,因为,它可以说是「Scaling Law」的开端——

如果你有一个非常大的数据集,训练一个非常大的神经网络,那么可以保证成功。

从广义上来说,后来发生的事情也的确如此。


接下来,Ilya提到了一个真正经得起时间考验的想法——联结主义(connectionism),这样说深度学习的核心思想。

这种理念认为,如果你愿意相信人工神经元在某种程度上有点像生物神经元,那么你就会相信,超大规模神经网络并不需要达到人类大脑的级别,就可以用来完成几乎所有人类能做的事。

但它与人类仍然不同。因为人类大脑会弄清楚自己如何配置,它使用的是最优的学习算法,需要与参数数量相当的数据点。

在这一点上,人类仍然更胜一筹。


所有这些,最终都引出了「预训练时代」。

这个时代,可以用GPT-2、GPT-3和Scaling Laws定义。

此处,ILya格外感谢了前同事Alec Radford,Jared Kaplan和Dario Amodei。

这项技术,是推动我们今日所见所有技术进步的核心驱动力。


预训练时代,即将终结

然而,我们所知的预训练路线,毫无疑问会终结。

为什么?

这是因为,尽管计算能力正通过更好的硬件、更优的算法和更大的集群不断增长,但数据量并没有增长——我们只有一个互联网。

甚至可以说,数据是AI的化石燃料。它们是以某种方式被创造出来的,而如今,我们已经达到了数据峰值,不可能再有更多数据了。

当然,目前现存的数据,仍能支持我们走得很远,但我们只有一个互联网。


接下来会发生什么?Ilya给出了下列预测。(或者只是提到他人的猜测)

首先,智能体会有一些突破,这些能自主完成任务的AI智能体,就是未来的发展方向。

其次,还会有一些模糊的合成数据,但这到底意味着什么?很多人都会取得有趣的进展。

最后,就是推理时计算了,最引人瞩目的例子,就是o1。在预训练后,我们接下来该探索什么?o1给出了生动的例子。


下面,是一个来自生物学的例子。

这张图,展示了哺乳动物的身体大小与大脑大小之间的关系。

在生物学中,一切都很混乱,但上面这个紧密联系,却是一个罕见的例子。

从人类及其近亲的进化分支上看,包括尼安德特人、能人等等,大脑与身体比例的缩放指数都不同。

这意味着在生物学中,确实存在不同比例缩放的先例。

如今我们所扩展的,可以说是第一个我们知道该如何扩展的事物。这个领域中的每个人,都会找到解决办法。

而我们在相关领域,也取得了惊人的进步。10年前这个领域的人,还会记得当时是多么无能为力。过去2年进入深度学习的人,可能都无法感同身受。


超级智能是未来,还会与意识结合

最后Ilya谈到的,就是超级智能(superintelligence)了。它是公认的发展方向,也是研究人员们正在构建的东西。

从本质上来说,超级智能与现在的AI完全不同。

目前,我们拥有出色的LLM和聊天机器人,但它们也表现出某些奇怪的不可靠性——时常会感到困惑,但却能在评估中表现出远超人类的能力。

虽然我们还不知道如何调和这一点,但最终迟早会实现以下目标:AI将真正具备实际意义上的智能体特性,并将正学会推理。

由于推理会引入了更多的复杂性,因此一个会推理的系统,推理量越多,就会变得越不可预测。相比之下,我们熟知的深度学习都是可以预测的。

举个例子,那些优秀的国际象棋AI,对于最顶尖的人类棋手来说就是不可预测的。

所以,我们将来不得不面对的,是一些极其不可预测的AI系统——它们能够从有限的数据中理解事物,同时也不会感到困惑。

同样,自我意识也是有用的,它构成了我们自身的一部分,同时也是我们世界模型中的一部分。

当所有这些特性与自我意识结合在一起时,就会带来与现有系统完全不同性质和特性的系统,它们将拥有令人难以置信的惊人能力。


当然,虽然无法确定如何实现、何时实现,但这终将发生。

至于这种系统可能带来的问题,就留给大家自己去想象吧。

毕竟预测未来是不可能的,任何事情都有可能发生。

参考资料:

https://x.com/_jasonwei/status/1867696401830096970

https://x.com/blueberry_feed/status/1867764724206629224

https://x.com/tmychow/status/1867695173783925071

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴西人才断档!U20国家队耻辱:0-6负阿根廷 曼城19岁妖星独造3球

巴西人才断档!U20国家队耻辱:0-6负阿根廷 曼城19岁妖星独造3球

风过乡
2025-01-25 13:56:50
赖清德:中国大陆如果出兵攻打台湾,台湾受到直接伤害!

赖清德:中国大陆如果出兵攻打台湾,台湾受到直接伤害!

星辰故事屋
2025-01-05 12:48:50
克林顿:我一生有两件事感到遗憾!一中国加入WTO,二我做错了

克林顿:我一生有两件事感到遗憾!一中国加入WTO,二我做错了

健身狂人
2025-01-23 16:07:55
2025东方卫视春晚:老中青8位主持人撑门面,独缺当红女主播王冠

2025东方卫视春晚:老中青8位主持人撑门面,独缺当红女主播王冠

晓今娱
2025-01-26 00:00:03
48岁赵薇哈尔滨吃糖葫芦!羽绒衣戴小红帽秒回18岁,还是那个小燕子

48岁赵薇哈尔滨吃糖葫芦!羽绒衣戴小红帽秒回18岁,还是那个小燕子

八星人
2025-01-23 23:07:24
结束兼职!唐尚珺开本田回家,轻松飙到114迈!网友:啥时候考的驾照?

结束兼职!唐尚珺开本田回家,轻松飙到114迈!网友:啥时候考的驾照?

趣笔谈
2025-01-25 20:50:14
女童失踪新细节出现:疑被拐走,摊贩提供新线索,阴谋论该消停了

女童失踪新细节出现:疑被拐走,摊贩提供新线索,阴谋论该消停了

小米亚的故事
2025-01-25 16:08:46
光纤制导FPV无人机,有根长度十几公里的光纤,难道不会拉断吗?

光纤制导FPV无人机,有根长度十几公里的光纤,难道不会拉断吗?

凯撒谈兵
2025-01-25 17:39:16
擦边卖肉,观众喊退钱,陈小纭翻拍《鲨滩》票房仅17万

擦边卖肉,观众喊退钱,陈小纭翻拍《鲨滩》票房仅17万

靠谱电影君
2025-01-17 15:01:34
董璇好惨!高云翔发文晒自拍!用落叶雪人自嘲,发际线后退老10岁

董璇好惨!高云翔发文晒自拍!用落叶雪人自嘲,发际线后退老10岁

扒星人
2025-01-24 20:32:52
河南淫医落网记:一月时间侵犯9名女性,最小的17岁

河南淫医落网记:一月时间侵犯9名女性,最小的17岁

星河逍遥游
2025-01-23 12:48:16
德约科维奇晒核磁照片:想给所有运动损伤“专家”看看

德约科维奇晒核磁照片:想给所有运动损伤“专家”看看

懂球帝
2025-01-25 23:43:08
作为央视春晚常客,却是流氓老板,把公司当后宫,染指多名女员工

作为央视春晚常客,却是流氓老板,把公司当后宫,染指多名女员工

阿胡
2025-01-07 12:21:46
网友:宝鸡与太白方向国道,出现大面积拥堵,卖防滑链的小赚一笔

网友:宝鸡与太白方向国道,出现大面积拥堵,卖防滑链的小赚一笔

火山诗话
2025-01-25 10:00:25
萝卜再次成为关注对象!医生告诫:吃萝卜要留意,这些误区不能踩

萝卜再次成为关注对象!医生告诫:吃萝卜要留意,这些误区不能踩

今日养生之道
2025-01-25 20:22:26
刚刚:四川乐山发生地震震中离大佛只有几十公里,重庆成都有震感

刚刚:四川乐山发生地震震中离大佛只有几十公里,重庆成都有震感

沧海一书客
2025-01-25 19:35:51
财色行长黄石山:将情妇从舞女提拔为副行长,利用职权敛财79亿

财色行长黄石山:将情妇从舞女提拔为副行长,利用职权敛财79亿

历史八卦社
2024-01-18 09:50:03
CCTV5直播澳网男单决赛,辛纳VS兹维列夫,谁能夺冠拿到350万澳元

CCTV5直播澳网男单决赛,辛纳VS兹维列夫,谁能夺冠拿到350万澳元

体育大学僧
2025-01-25 11:16:44
如果不是12306爆料,我们还傻乎乎地被第三方平台玩弄于掌心之中

如果不是12306爆料,我们还傻乎乎地被第三方平台玩弄于掌心之中

猫小狸同学
2025-01-22 20:05:03
阿隆索:有机会杀死比赛但没能把握机会,最后的结局有点遗憾

阿隆索:有机会杀死比赛但没能把握机会,最后的结局有点遗憾

直播吧
2025-01-26 06:35:15
2025-01-26 07:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
12066文章数 65788关注度
往期回顾 全部

科技要闻

焕新ModelY微调 品牌仍是特斯拉最大护城河

头条要闻

女子乘高铁“买短乘长”还霸座被行拘5日

头条要闻

女子乘高铁“买短乘长”还霸座被行拘5日

体育要闻

东部巨头,以己之短,对彼之相对短?

娱乐要闻

李小冉又挨骂!哭着道歉又发弹幕阴阳

财经要闻

五天暴涨900点!人民币汇率新春狂飙

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

艺术
房产
本地
教育
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

吞吐量创历史新高,三亚旅游的泼天流量真的来了?

本地新闻

全球迎新 | 2025蛇年春节

教育要闻

童程童美暴雷,三年前就有先兆

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版