OpenAI 创始成员、前特斯拉人工智能高级总监,人工智能大神 Andrej Karpathy 在红杉资本的 AI Ascent 上与 Stephanie Zhan 谈论了建立一个更加开放和充满活力的人工智能生态系统的重要性、马斯克(Elon Musk)共事的感受,以及我们如何才能让人工智能的应用更加普及
要点如下:
1. 通用人工智能 (AGI) 触手可及
几年前,AGI 看起来还很遥远,但现在它似乎近在咫尺。Andrej认为,目前的发展方向是构建类似“大型语言模型操作系统 (LLMOS)”的平台,它可以连接文本、图像、音频等各种模态,并与现有的软件基础设施相结合
2. OpenAI 的主导地位和创业公司的机会
OpenAI 正在构建 LLMOS 平台,并可能会提供一些默认应用程序,但这并不意味着其他公司没有机会。Karpathy 认为,就像早期的 iPhone 应用一样,现在人们正在探索 LLM 的功能和局限性,未来将出现一个充满活力的应用生态系统,针对不同领域进行微调
3. 规模、专业知识和开源模型
规模是训练大型模型的关键因素,但也需要专业知识和精心准备的数据集。Andrej指出,仅仅拥有资金和计算资源并不足以训练出这些模型,还需要基础设施、算法和数据方面的专业知识。他还强调了完全开源模型的重要性,因为它们允许更深入的定制和改进
4. 当前 LLM 研究的挑战
Andrej认为,当前 LLM 研究面临的挑战包括:
弥合扩散模型和其他生成模型之间的差距
提高模型运行的能量效率
改进模型的精度和稀疏性
重新思考冯·诺依曼架构的局限性
5. 向 Elon Musk 学习
Andrej从与 Elon Musk 的合作中学到了很多东西,包括:
保持团队精简、强大和技术性。
营造充满活力和高强度的文化氛围。
领导者与团队保持紧密联系。
积极消除瓶颈并快速做出决策。
6. 对人工智能创业者的建议
Andrej鼓励创业者:
首先专注于构建性能最佳的模型,然后再考虑降低成本。
积极分享经验和知识,促进生态系统的健康发展。
关注如何帮助初创公司在与大型科技公司的竞争中取得成功
以下对话全文:
Stephanie: Andrej 不需要过多介绍,但我想简单介绍一下他迄今为止的旅程。正如 Sonya 所介绍的,他师从 Jeff Hinton 和 Fei-Fei Li,他第一次成名是在斯坦福大学开设深度学习课程。他于 2015 年与他人共同创立了 OpenAI,2017 年被 Elon 挖走。我记得这件事非常清楚,对于不记得当时情况的人来说,Elon 刚刚经历了六位不同的自动驾驶汽车负责人,每位都只干了六个月。我记得 Andrej 接手这份工作时,我心想,恭喜你,祝你好运!不久之后,他又回到了 OpenAI,并在那里工作了最后一年。现在,与我们今天所有人不同的是,他正沐浴在自由和责任的终极荣耀中,所以我们真的很期待看到你今天要分享的内容。我从 Andrej 身上学到的最宝贵的东西是,他是一位令人难以置信的、有远见的未来主义思想家,他是一位不屈不挠的乐观主义者,他是一位非常务实的建设者。所以我认为他今天会分享一些他在这方面的见解
未来十年人工智能的发展
Stephanie:即使在 7 年前,AGI 看起来也是一项不可能完成的任务,即使在我们有生之年也无法实现。现在它似乎近在咫尺。你对未来十年的看法是什么?
Andrej:我认为你是对的。我认为几年前,我感觉 AGI 还不清楚它将如何发生,它非常学术化,你会思考不同的方法。而现在,我认为它非常清晰,并且有很多空间,每个人都在试图填补它。所以有很多优化,我认为大致上事情的发展方式是,每个人都在试图构建我所说的这种 LLMOS。基本上,我喜欢把它想象成一个操作系统,你必须获得一堆基本上可以插入这个新 CPU 的外围设备,诸如此类。外围设备当然是文本、图像、音频和所有模态,然后你有一个 CPU,它是 LLM Transformer 本身,然后它也连接到我们已经为自己构建的所有软件 1.0 基础设施。所以我认为每个人都在试图构建这样的东西,然后把它变成可定制的东西,以适应经济的各个角落。所以我认为这大致上是每个人都在努力的方向,也是我们今天早些时候听到的内容。所以我认为,未来发展方向是,我们可以启动和关闭这些相对独立的代理,我们可以向它们分配高级任务,并以各种方式进行专业化。所以,我认为这将是非常有趣和令人兴奋的,它不仅仅是一个代理,而是许多代理,这将是什么样子?
Stephanie:如果这种对未来的看法是正确的,我们应该如何以不同的方式生活?
Andrej:我不知道,我猜我们必须努力建立影响力,确保它是好的,是的,只是努力确保它最终会很好
OpenAI 的主导地位和创业公司的机会
Stephanie:现在你是一个自由独立的代理人,我想谈谈房间里的大象,那就是 OpenAI 正在主导这个生态系统,今天我们的大多数观众都是创始人,他们正试图开拓一个小众市场,祈祷 OpenAI 不会在一夜之间将他们淘汰。你认为其他参与者还有哪些机会建立新的独立公司,哪些领域你认为 OpenAI 会继续主导,即使它的野心越来越大?
Andrej:我的总体印象是,OpenAI 正在尝试构建这个 LLMOS 操作系统,我认为,正如我们今天早些时候听到的,就像微软试图在其上开发这个平台,你可以在这个平台上定位不同的公司和不同的垂直领域。现在,我认为操作系统类比也非常有趣,因为当你看看 Windows 或类似的东西时,这些也是操作系统,它们带有一些默认应用程序,比如 Windows 自带浏览器,你可以使用 Edge 浏览器。所以我认为,以同样的方式,OpenAI 或任何其他公司可能会提出一些默认的应用程序,但并不意味着你不能拥有运行在它上面的不同浏览器,就像你可以拥有运行在该基础设施上的不同聊天代理一样。所以,会有一些默认的应用程序,但也可能会有一个充满活力的生态系统,包含各种针对经济各个角落进行微调的应用程序。我真的很喜欢早期 iPhone 应用程序的类比,以及它们的样子,它们都是笑话,这需要时间来发展。我认为我们现在绝对正在经历同样的事情,人们正在试图弄清楚这是什么东西,它擅长什么,它不擅长什么,我如何使用它,我如何用它编程,我如何调试它,我如何让它执行真正的任务,以及什么样的监督,因为它非常自主,但不是完全自主。所以监督是什么样的,评估是什么样的,有很多事情需要思考,只是为了了解它的心理学,我认为这需要一些时间来弄清楚如何使用这个基础设施。所以我认为我们会在未来几年看到这一点
LLM生态系统的未来
Stephanie:现在 LLM 领域的竞争非常激烈,OpenAI、Anthropic、Mistral、Llama、Gemini 以及整个开源模型生态系统,现在还有很多小型模型。你预见未来这个生态系统会如何发展?
Andrej:我再次认为,开源,抱歉,操作系统知识很有趣,因为我们有,比如说,我们基本上有几个专有系统的寡头垄断,比如 Windows、Mac OS 等等,然后我们还有 Linux。Linux 有无数个发行版,所以我认为它可能看起来像那样。我还认为我们必须小心命名,因为你列出的很多模型,比如 Llama、Mistral 等等,我实际上不会说它们是开源的,对吧?所以这有点像为操作系统扔一个二进制文件,你知道,你可以使用它,它很有用,但它不是完全有用,对吧?而且,我认为有许多我称之为完全开源的 LLM,比如 EleutherAI 的 GPT-Neo、Pythia 模型、LM360、LMO 等等,它们完全发布了编译操作系统所需的全部基础设施,对吧?从数据中训练模型,收集数据等等。所以,当你只得到二进制文件时,它当然要好得多,因为你可以微调模型,这很有用,但我也认为它很微妙,你不能完全微调模型,因为你对模型进行微调的越多,它就越会开始在其他所有事情上退化。所以,例如,如果你想添加功能,你实际上真正想做的是,在不退化其他功能的情况下添加知识,如果你只是得到权重,你实际上不能做到这一点,你需要训练循环,你需要数据集等等。所以你实际上在如何使用这些模型方面受到限制,我认为这绝对是有帮助的,但我认为我们需要稍微好一点的语言来描述它。所以有开放权重模型、开源模型,然后是专有模型,我猜这可能就是生态系统,是的,它可能看起来与我们今天拥有的非常相似
训练大型模型的关键因素
Stephanie:希望你会继续帮助构建其中的一部分。所以,我想谈谈房间里的另一个大象,那就是规模。简单地说,似乎规模是唯一重要的,数据的规模,计算的规模,因此大型研究实验室,大型科技巨头今天拥有巨大的优势。你对此有何看法?这是唯一重要的吗?如果不是,还有什么重要的?
Andrej:我会说规模绝对是第一位的,我确实认为有一些细节需要做好,我认为很多工作也涉及数据集的准备等等,使其非常好和干净,我认为这很重要,这些都是你可以获得的计算效率提升。所以有数据、算法,然后当然还有模型的训练,使其真正庞大。所以我认为规模将是决定性因素,是事物的第一个主要组成部分,但还有许多其他事情你需要做好。所以这几乎就像,规模设定了某种速度限制,但你确实需要其他一些东西,但如果你没有规模,那么你基本上就无法训练这些大型模型。如果你只是要进行微调等等,那么我认为可能需要更少的规模,但我们还没有真正看到这一点完全发挥作用
Stephanie:你能分享更多关于你认为重要的其他因素吗?也许优先级低于规模?
Andrej:我认为,首先,如果你只是得到钱和规模,你不能只是训练这些模型,实际上构建这些模型仍然非常困难。部分原因是基础设施仍然很新,它仍在开发中,还没有完全到位。但是,大规模训练这些模型非常困难,这是一个非常复杂的分布式优化问题,实际上,这方面的人才现在相当稀缺。它基本上变成了运行在数万个 GPU 上的疯狂的东西,所有这些 GPU 都在不同的时间点随机失效,所以检测它并让它工作实际上是一个极其困难的挑战。直到最近,GPU 才被用于 10000 个 GPU 的工作负载,所以我认为很多基础设施都在这种压力下吱吱作响,我们需要克服这一点。但是现在,如果你只是给某人一大笔钱或一大堆规模或 GPU,我并不认为他们可以轻易地生产出这些模型中的一个。这就是为什么它不仅仅是规模的问题,你实际上需要大量的专业知识,包括基础设施方面、算法方面,以及数据方面的谨慎处理。所以我认为这些是主要组成部分
当前LLM研究挑战
Stephanie:生态系统发展得如此之快,甚至我们一年前认为存在的一些挑战,今天也越来越多地得到解决。幻觉、上下文窗口、多模态能力、推理越来越好、越来越快、越来越便宜。今天 LLM 研究中有哪些挑战让你夜不能寐?你认为哪些问题是迫切需要解决的,同时也是可以解决的?
Andrej:我在算法方面说过,我一直在思考的一件事是扩散模型和其他自回归模型之间的这种明显分离,它们都是表示概率分布的方式,结果表明不同的模态显然更适合其中一种。我认为可能有一些空间来统一它们,或者以某种方式将它们连接起来,并获得一些最佳结果,或者弄清楚如何获得混合架构等等。所以对我来说,奇怪的是,我们在模型空间中有 两个独立的点,它们都非常好,而它们之间没有任何东西,这对我来说感觉不对。所以我认为我们会看到这一点被解决,我认为那里存在着有趣的问题。然后,我可能要指出的另一件事是,在运行所有这些东西的能量效率方面仍然存在着巨大的差距。我的大脑大约是 20 瓦,Jensen 刚刚在 GTC 上谈论了他们现在正在建造的大型超级计算机,这些数字都是兆瓦级的,对吧?所以也许你不需要所有这些来运行像大脑一样的东西,我不知道你需要多少,但可以肯定地说,我们在效率方面可能差了 1000 倍到 100 万倍,运行这些模型的效率。我认为部分原因只是因为我们设计的计算机不适合这种工作负载,我认为 Nvidia GPU 是朝着这个方向迈出的良好一步,因为你需要极高的并行性,我们实际上并不关心以某种方式依赖于数据的顺序计算,我们只需要将相同的算法应用于许多不同的数组元素,你可以这样想。所以我认为,第一位的是使计算机架构适应新的数据工作流程,第二位是推动我们目前看到改进的一些事情。也许第一位是精度,我们看到精度从最初的 64 位双精度下降到我不知道是 4、5、6 还是 1.58,这取决于你读的论文。所以我认为精度是控制这一点的一个重要杠杆,然后第二个当然是稀疏性,这也是另一个重要的变化。我想说,你的大脑并不总是完全活跃的,所以我认为稀疏性是另一个重要的杠杆。但最后一个杠杆,我感觉只是计算机的冯·诺依曼架构,以及它们如何构建,你在内存和核心之间来回传输数据,做大量的计算,这些都是坏掉的,这不是你的大脑工作的方式,这就是为什么它如此高效。所以我认为这应该是计算机架构中一个非常令人兴奋的时代,我不是计算机架构师,但我认为我们似乎差了 1000 倍到 100 万倍,应该会有非常令人兴奋的创新,将这一点降低。我认为观众中至少有几个建设者正在研究这个问题。
Elon Musk 的管理风格
Stephanie: 好吧,稍微换个话题,你曾与我们这一代的许多伟人并肩工作,Sam、Greg 来自 OpenAI,还有 OpenAI 团队的其他成员,Elon Musk。通过与这些杰出的领导者如此密切地合作,你学到了什么?
Andrej:我会说,Elon 绝对以一种非常独特的风格经营他的公司,我实际上认为人们并没有意识到它是多么独特,你甚至在某种程度上读到它,你也不理解它。我认为,这甚至很难描述,我甚至不知道从哪里开始,但它就像是一件非常独特、不同的事情。我喜欢说他经营着最大的初创公司,我认为这只是,我甚至不知道如何描述它,它几乎感觉像是一个更长的,我必须思考的事情。但第一,他喜欢非常小、强壮、技术性强的团队,这是第一。我会说,在公司里,默认情况下,团队会增长,会变得庞大,Elon 总是反对增长的力量,我必须努力招聘人员,我必须像流血一样招聘人员。另一件事是,在 大公司里,通常情况下,你想要摆脱低绩效员工是非常困难的,我认为 Elon 非常倾向于默认情况下摆脱低绩效员工。所以我实际上必须为人们争取,让他们留在团队中,因为他默认情况下会想要解雇他们。所以这是一件事,保持一个小型、强壮、技术性强的团队,没有非技术性的中层管理人员,这是第一。第二是所有事情的运作方式和感觉,当他走进办公室时,他希望它是一个充满活力的地方,人们走来走去,他们来回踱步,他们在做令人兴奋的事情,他们在绘制图表,他们在编码,他不喜欢停滞不前,他不喜欢看到它看起来像那样,他不喜欢大型会议,他总是鼓励人们在会议没有用处的时候离开。所以实际上你会看到这种情况,或者这是一个大型会议,如果你没有贡献,你没有学习,就走出去,这是完全被鼓励的,我认为这是你通常不会看到的事情。所以我认为氛围是第二个重要的杠杆,我认为他真正灌输了文化。也许其中的一部分也是,我认为很多大公司,他们喜欢纵容员工,我认为这更少,就像它的文化是,你来这里是做你最好的技术工作,有强度等等。我认为最后一个非常独特、非常有趣、非常奇怪的是,他与团队的联系是多么紧密。通常情况下,公司首席执行官是一个遥远的人,高高在上,与他们的私人助理交谈,私人助理与他们的报告和董事交谈,最终你与你的经理交谈,这不是 Elon 的公司运作方式,对吧?他会来办公室,他会与工程师交谈,我们举行的许多会议都是这样的,好吧,房间里有 50 个人和 Elon,他直接与工程师交谈,他不想只与副总裁和董事交谈。所以,我,你知道,通常情况下,人们会花 99% 的时间与副总裁交谈,他可能只花 50% 的时间,他只是想与工程师交谈。所以,如果团队规模小、实力强,那么工程师和代码就是真理的来源,所以他们拥有真理的来源,而不是某个经理,他想与他们交谈,了解事情的实际状态,以及应该做些什么来改进它。所以我认为他与团队的联系程度,而不是某种遥远的东西,也是独特的。还有,就像他的大锤,以及他愿意在组织内使用它的意愿。所以,也许如果他与工程师交谈,他们提出阻碍你的是什么,好吧,我只是没有足够的 GPU 来运行我的东西,他会说,哦,好吧,如果他听到两次,他会说,好吧,这是一个问题,所以我们的时间表是什么?当你没有令人满意的答案时,他会说,好吧,我想和负责 GPU 集群的人谈谈,然后有人拨打电话,他只是说,好吧,现在就把集群扩大一倍,让我们明天开会,从现在开始,每天发送关于集群的更新,直到它的大小增加一倍。然后他们有点推诿,他们说,好吧,我们有这个采购设置,我们有这个时间表,英伟达说我们没有足够的 GPU,这将需要六个月或类似的时间。然后你会看到他扬起眉毛,然后他说,好吧,我要和 Jensen 谈谈,然后他就消除了瓶颈。所以我认为,他参与的程度,消除瓶颈,以及使用他的大锤,我认为也是没有被人们所欣赏的。所以我认为有很多这样的方面是非常独特的,我认为非常有趣,老实说,去一家正常的公司,在那种环境之外,你肯定会错过这些方面的。所以我认为,是的,这可能是一个很长的范围,但这只是,我认为我没有触及所有要点,但它是一件非常独特的事情,非常有趣,是的,我猜这就是我的品牌
对人工智能创业者的建议
Stephanie: 希望这里的大多数人都能采用这些策略。退一步说,你帮助建立了一些最具时代性的公司,你也帮助许多人,其中许多人今天都在观众席上,进入人工智能领域。我知道你最关心的是普及人工智能教育和工具,帮助在整个生态系统中创造更多的平等,让更多的人成为赢家。当你思考你人生的下一章时,什么对你来说最有意义?
Andrej:我认为你已经用正确的方式描述了它,我的大脑默认情况下会想,你知道,我为几家公司工作过,但我认为,最终我并不关心任何一家特定的公司,我更关心生态系统,我希望生态系统是健康的,我希望它蓬勃发展,我希望它像一个充满各种酷炫、令人兴奋的初创公司的珊瑚礁,我希望整个事情就像一锅沸腾的汤,里面充满了酷炫的东西
Stephanie:每年 Andrej 都会梦到珊瑚礁
Andrej:你知道,我希望它成为一个很酷的地方,我认为这就是为什么我喜欢初创公司,我喜欢公司,我希望有一个充满活力的生态系统。默认情况下,我会对那种大型科技公司接管一切更加犹豫,尤其是 AGI 作为一种力量放大器,我有点担心那会是什么样子等等。所以我必须更多地思考这个问题,但是,是的,我喜欢生态系统,我希望它是健康和充满活力的。
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.