人工智能领域最大的突破尚未到来,并且需要的不仅仅是芯片。
编译|刘杨楠
去年大部分时间,OpenAI在科技行业的地位似乎很难撼动,他们推出的ChatGPT在全球引发了巨大的兴奋和炒作。
谷歌 DeepMind的CEO Demis Hassabis(戴密斯·哈萨比斯)最近领导开发并部署了一种似乎与OpenAI的机器人一样能干且具备创新能力的AI模型——Gemini 1.5 Pro。
自从去年四月谷歌将其两个专注于AI的部门合并成DeepMind以来,Hassabis就负责整合其科学家和工程师,以对抗OpenAI的崛起以及其与微软的合作,OpenAI和微软的组合被认为是谷歌现金牛搜索业务的潜在威胁。
谷歌的研究人员提出了几个构建ChatGPT的想法,但由于担心它们可能做出不当行为或被滥用,谷歌没有把这些想法商业化。最近几个月,在Hassabis的督促下,谷歌的AI研究和发布速度发生了戏剧性转变,迅速开发了Gemini,这是一个“多模态”AI模型,是谷歌对ChatGPT的回应,并对越来越多的谷歌产品提供动力。就在上周,仅仅在Gemini公布两个月后,公司宣布了对免费版本的快速升级,即Gemini 1.5 Pro,它尺寸更小但性能更强大,能够同时分析大量文本、视频和音频。
在当前的AI竞赛中,各家公司都在竞相开发和交付更大、更有用的AI系统。谷歌对其最强大的模型Gemini Ultra进行了类似的提升,又推了OpenAI一把。
Hassabis在伦敦的家中与WIRED的高级作家Will Knight进行了交谈。这次采访经过了轻微的编辑,以缩短长度和清晰度。
WIRED:Gemini 1.5 Pro可以处理比其前身更多的数据输入,它规模更小却也更强大,这要归功于一种名为“专家混合”(MoE)的架构。这些事有什么意义?
Demis Hassabis:你现在可以摄入一个大小合理的短片。如果你正在学习某个话题,有一个一小时的讲座,你想找其中某个特定的事实或他们在某个时间做了某件事,Gemini 1.5 Pro将非常有用。我认为这将有很多非常酷的用例。
谷歌DeepMind首席科学家Jeff Dean发明了“专家混合”架构,我们开发了新版本。新版Gemini Pro虽然还没有经过广泛的测试,但它的性能大致与前一代架构中最大的模型相当。显然,我们可以用这些创新创建一个超大规模的模型,这是我们正在研究的事情。
WIRED:在过去的几年里,增加用于训练AI模型的计算机能力和数据量推动了惊人的进步。据说Sam Altman正在筹集高达7万亿美元的资金用于更多的AI芯片。更大规模的计算机功率是否是解锁通用人工智能的关键?
Demis Hassabis:我被误导了吗?我听到有人说可能是日元或其他什么。通用人工智能需要规模,这就是Nvidia今天值这么多钱的原因,也是Sam试图筹集巨量资金投入芯片研发的原因。但我们与许多组织有一点不同在于,我们一直把基础研究放在首位。过去十年,谷歌Research、Brain以及DeepMind发明了我们今天都在使用的大部分机器学习技术,这一直是我们的DNA,我们有很多其他组织可能没有的资深研究科学家。其他初创公司甚至大公司的工程与研究科学比例都很高。
WIRED:你是说,算力规模不会成为今后AI进步的唯一方式?
Demis Hassabis:我相信,要达到AGI(通用人工智能),你可能还需要更多的创新,以及最大的规模。规模的增长没有放缓,我们没有看到任何规模边界,仍然有进步的空间。所以我认为,你必须推动现有技术,看看它们能走多远,但仅仅扩大现有技术,你很难获得新的能力。如规划、工具使用或代理行为,这些不会神奇地发生。
你需要探索的另一件事是计算本身。理想情况下,你希望能够在几天内训练一个玩具问题,但你会发现在玩具问题规模上有效的东西在更大规模上往往不成立,有一种有效的方法是,你可以把训练规模扩大约10倍。
(注:在科学学科中,玩具问题是指那些不具备即时科学价值的问题,但它们被用作阐述设备,用来说明那些更复杂的问题实例可能具有的共性,或者作为一种解释特定、更普遍的问题解决技巧的方式。)
WIRED:这是否意味着,未来AI公司之间的竞争将越来越多地围绕工具使用和Agent等真正做事的AI,而不仅仅是聊天?据说OpenAI正在研究这个。
Demis Hassabis:可能吧。自从AlphaGo时代以来,我们已经在Agent、强化学习和规划的路上走了很长时间,这是我们真正的强项。我们正在重新审视很多想法,考虑将AlphaGo的能力建立在这些大型模型之上,我认为内省和规划能力将有助于解决幻觉等问题。
这有点有趣,如果你和模型说“小心点”或“弄清楚你的推理”,有时模型会做得更好,这本质是你在引导它更有逻辑地思考步骤。但你希望这成为一个系统性的东西。
这绝对是一个巨大的领域。我们正在投入大量的时间和精力,我们相信,当AI开始变得更像Agent,将是这些类型系统的能力的一次重大变革。我们正在这个方向上大力投资,我相信其他人也在这样做。
WIRED:这会不会让AI模型有更多潜在危险?
Demis Hassabis:我一直在安全论坛和会议上说,这是一次重大变革。一旦我们让Agent系统工作,AI将与当前的系统非常不同,它们将突然成为主动学习者。当然,它们也会更有用,因为它们将能够为你完成任务。但我们必须更加小心。
我一直在倡导建立坚固的模拟沙箱,在将Agent系统放在网上之前对其进行测试。还有很多其他建议,但我认为行业应该开始真正考虑Agent系统的出现,也许还有几年,也许更快,但这将是一个不同类别的系统。
WIRED:你之前说,需要更长的时间测试你们最强的模型Gemini Ultra。这仅仅是因为开发速度,还是因为模型本身的问题?
Demis Hassabis:实际上两者都有。首先,模型越大,微调时有些事情就变得更复杂,所以需要更长的时间。更大的模型也需要测试更多的能力。
希望你们注意到,谷歌 DeepMind正在成为一个单一的组织,我们发布东西前,会将实验性的成果交给少数人使用,看看我们信任的早期测试者会告诉我们什么,然后我们可以在全面发布之前修改东西。
WIRED:说到安全,与像英国AI安全研究所这样的政府组织的讨论进展如何?
Demis Hassabis:进展顺利。我不确定我可以说些什么,因为这都是保密的。他们可以访问我们的前沿模型,他们正在测试Ultra,我们将继续与他们紧密合作。我认为美国正在建立类似的机构,这些都是Bletchly Park人工智能安全峰会的良好成果,他们可以检查我们没有安全许可检查的东西——CBRN(化学、生物、放射性和核武器)等。
我认为当前的AI系统还没有强大到做出任何实质性的令人担忧的事情。但现在在政府、行业和学术界的各个方面建立这种安全监管能力是好的。我认为Agent系统将是下一个重大变革。我们将看到逐步的改进,可能会有一些很酷的大改进,这会让我们感受到很大的不同。
(封面图来自WIRED)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.