谷歌DeepMind CEO哈萨比斯：Scale只能带你走这么远|科学家|桌上游戏|demis|游戏设计师|人工智能技术|deepmind|hassabis|杰米斯·哈萨比斯

谷歌DeepMind CEO哈萨比斯：Scale只能带你走这么远

2024-02-23 18:10:36　来源: 甲子光年

北京举报

分享至

人工智能领域最大的突破尚未到来，并且需要的不仅仅是芯片。

编译｜刘杨楠

去年大部分时间，OpenAI在科技行业的地位似乎很难撼动，他们推出的ChatGPT在全球引发了巨大的兴奋和炒作。

谷歌 DeepMind的CEO Demis Hassabis（戴密斯·哈萨比斯）最近领导开发并部署了一种似乎与OpenAI的机器人一样能干且具备创新能力的AI模型——Gemini 1.5 Pro。

自从去年四月谷歌将其两个专注于AI的部门合并成DeepMind以来，Hassabis就负责整合其科学家和工程师，以对抗OpenAI的崛起以及其与微软的合作，OpenAI和微软的组合被认为是谷歌现金牛搜索业务的潜在威胁。

谷歌的研究人员提出了几个构建ChatGPT的想法，但由于担心它们可能做出不当行为或被滥用，谷歌没有把这些想法商业化。最近几个月，在Hassabis的督促下，谷歌的AI研究和发布速度发生了戏剧性转变，迅速开发了Gemini，这是一个“多模态”AI模型，是谷歌对ChatGPT的回应，并对越来越多的谷歌产品提供动力。就在上周，仅仅在Gemini公布两个月后，公司宣布了对免费版本的快速升级，即Gemini 1.5 Pro，它尺寸更小但性能更强大，能够同时分析大量文本、视频和音频。

在当前的AI竞赛中，各家公司都在竞相开发和交付更大、更有用的AI系统。谷歌对其最强大的模型Gemini Ultra进行了类似的提升，又推了OpenAI一把。

Hassabis在伦敦的家中与WIRED的高级作家Will Knight进行了交谈。这次采访经过了轻微的编辑，以缩短长度和清晰度。

WIRED：Gemini 1.5 Pro可以处理比其前身更多的数据输入，它规模更小却也更强大，这要归功于一种名为“专家混合”（MoE）的架构。这些事有什么意义？

Demis Hassabis：你现在可以摄入一个大小合理的短片。如果你正在学习某个话题，有一个一小时的讲座，你想找其中某个特定的事实或他们在某个时间做了某件事，Gemini 1.5 Pro将非常有用。我认为这将有很多非常酷的用例。

谷歌DeepMind首席科学家Jeff Dean发明了“专家混合”架构，我们开发了新版本。新版Gemini Pro虽然还没有经过广泛的测试，但它的性能大致与前一代架构中最大的模型相当。显然，我们可以用这些创新创建一个超大规模的模型，这是我们正在研究的事情。

WIRED：在过去的几年里，增加用于训练AI模型的计算机能力和数据量推动了惊人的进步。据说Sam Altman正在筹集高达7万亿美元的资金用于更多的AI芯片。更大规模的计算机功率是否是解锁通用人工智能的关键？

Demis Hassabis：我被误导了吗？我听到有人说可能是日元或其他什么。通用人工智能需要规模，这就是Nvidia今天值这么多钱的原因，也是Sam试图筹集巨量资金投入芯片研发的原因。但我们与许多组织有一点不同在于，我们一直把基础研究放在首位。过去十年，谷歌Research、Brain以及DeepMind发明了我们今天都在使用的大部分机器学习技术，这一直是我们的DNA，我们有很多其他组织可能没有的资深研究科学家。其他初创公司甚至大公司的工程与研究科学比例都很高。

WIRED：你是说，算力规模不会成为今后AI进步的唯一方式？

Demis Hassabis：我相信，要达到AGI（通用人工智能），你可能还需要更多的创新，以及最大的规模。规模的增长没有放缓，我们没有看到任何规模边界，仍然有进步的空间。所以我认为，你必须推动现有技术，看看它们能走多远，但仅仅扩大现有技术，你很难获得新的能力。如规划、工具使用或代理行为，这些不会神奇地发生。

你需要探索的另一件事是计算本身。理想情况下，你希望能够在几天内训练一个玩具问题，但你会发现在玩具问题规模上有效的东西在更大规模上往往不成立，有一种有效的方法是，你可以把训练规模扩大约10倍。

（注：在科学学科中，玩具问题是指那些不具备即时科学价值的问题，但它们被用作阐述设备，用来说明那些更复杂的问题实例可能具有的共性，或者作为一种解释特定、更普遍的问题解决技巧的方式。）

WIRED：这是否意味着，未来AI公司之间的竞争将越来越多地围绕工具使用和Agent等真正做事的AI，而不仅仅是聊天？据说OpenAI正在研究这个。

Demis Hassabis：可能吧。自从AlphaGo时代以来，我们已经在Agent、强化学习和规划的路上走了很长时间，这是我们真正的强项。我们正在重新审视很多想法，考虑将AlphaGo的能力建立在这些大型模型之上，我认为内省和规划能力将有助于解决幻觉等问题。

这有点有趣，如果你和模型说“小心点”或“弄清楚你的推理”，有时模型会做得更好，这本质是你在引导它更有逻辑地思考步骤。但你希望这成为一个系统性的东西。

这绝对是一个巨大的领域。我们正在投入大量的时间和精力，我们相信，当AI开始变得更像Agent，将是这些类型系统的能力的一次重大变革。我们正在这个方向上大力投资，我相信其他人也在这样做。

WIRED：这会不会让AI模型有更多潜在危险？

Demis Hassabis：我一直在安全论坛和会议上说，这是一次重大变革。一旦我们让Agent系统工作，AI将与当前的系统非常不同，它们将突然成为主动学习者。当然，它们也会更有用，因为它们将能够为你完成任务。但我们必须更加小心。

我一直在倡导建立坚固的模拟沙箱，在将Agent系统放在网上之前对其进行测试。还有很多其他建议，但我认为行业应该开始真正考虑Agent系统的出现，也许还有几年，也许更快，但这将是一个不同类别的系统。

WIRED：你之前说，需要更长的时间测试你们最强的模型Gemini Ultra。这仅仅是因为开发速度，还是因为模型本身的问题？

Demis Hassabis：实际上两者都有。首先，模型越大，微调时有些事情就变得更复杂，所以需要更长的时间。更大的模型也需要测试更多的能力。

希望你们注意到，谷歌 DeepMind正在成为一个单一的组织，我们发布东西前，会将实验性的成果交给少数人使用，看看我们信任的早期测试者会告诉我们什么，然后我们可以在全面发布之前修改东西。

WIRED：说到安全，与像英国AI安全研究所这样的政府组织的讨论进展如何？

Demis Hassabis：进展顺利。我不确定我可以说些什么，因为这都是保密的。他们可以访问我们的前沿模型，他们正在测试Ultra，我们将继续与他们紧密合作。我认为美国正在建立类似的机构，这些都是Bletchly Park人工智能安全峰会的良好成果，他们可以检查我们没有安全许可检查的东西——CBRN（化学、生物、放射性和核武器）等。

我认为当前的AI系统还没有强大到做出任何实质性的令人担忧的事情。但现在在政府、行业和学术界的各个方面建立这种安全监管能力是好的。我认为Agent系统将是下一个重大变革。我们将看到逐步的改进，可能会有一些很酷的大改进，这会让我们感受到很大的不同。

（封面图来自WIRED）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.