谢尔盖·布林:我们曾经拥有五六项机器人业务 —— 不幸的是,我们放弃得有点太早了。
文 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)
本文为 CSDN 编辑整理,未经授权禁止转载,违者必究。
近日,谷歌(Google)的联合创始人谢尔盖·布林在一场播客活动中现身,并表示谷歌公司的工程师使用人工智能的频率没有达到他认为应该的高度。
作为互联网时代的先驱之一,谢尔盖·布林(Sergey Brin)与拉里·佩奇(Larry Page)共同创立谷歌时,可能并未预见到人工智能会在短短二十余年内如此迅速地改变世界。然而,正是这种变革的力量,吸引了布林在经历了一段“退居二线”的时期后,重新投入到公司的日常运营中来。
回顾 2019 年,科技界曾为之震动。在那一年的 12 月初,布林和佩奇一起宣布卸任 Alphabet(谷歌母公司)的总裁和 CEO 职务,标志着谷歌进入了新的时代,由桑达尔·皮查伊全面接管谷歌和 Alphabet 的管理重任。当时,布林和佩奇在一封公开信中表示,“现在是简化管理结构的好时机”,他们认为公司已经不需要两位 CEO 和一位总裁。
不过,布林的回归并非偶然。早在去年的时候,就有消息称布林被 AI 吸引了回来,并参与了 Google Gemini 模型的建设当中。在这次公开发言中,布林表示,他现在几乎每天都回谷歌敲代码,并专注于 AI 技术的发展。然而,布林也注意到,谷歌的工程师在日常工作中使用这些工具的频率还不够高,甚至认为“”。
下文是本次谢尔盖·布林最新对话的全部内容,经过精编处理:
谢尔盖·布林:我直到开始之前才同意参加这场活动 —— 坦白说,我起初并不清楚情况。我以为这里只是一个播客录制和小型聚会,但实际上这里的规模远超我的预期。
主持人:没错,这是次计划外的对话,让我有些小激动。你与拉里·佩奇在 1998 年共同创立了谷歌,近期有报道称你将投入更多精力研究人工智能。许多行业分析家和专家一直在探讨,大语言模型和 AI 聊天机器人对 Google 搜索构成了生存威胁。关于 Google 的未来及其在 AI 领域的地位,存在许多不同的观点,而你在这方面的投入众所周知。因此,请问你目前在 Google 花费了多少时间专注于 AI?
谢尔盖·布林:实际上,几乎是每天都投入其中—— 当然,今天是个例外,所以我之前犹豫到底要不要来参加。但我现在很开心能够来到这里。
作为一名计算机科学家,我认为过去几年中人工智能的进步是前所未有的。每个月都有新的令人惊叹的功能涌现,特别是在各种 AI 工具的应用方面。当我在 90 年代攻读研究生学位的时候,AI 还仅是课程中的一个次要部分。我们尝试过多种方法实现人工智能,但大多未能奏效。然而,随着计算能力和数据量的增长,再加上一些创新算法的发展,那些一度被放弃的研究领域如神经网络再次取得了突破。对于计算机科学领域而言,这无疑是激动人心的变化。对我而言,这种技术革命促使我重新投身于技术研发之中,因为我作为一个计算机科学家,不愿错过这一历史性的变革。
主持人:那么,AI 是否仅限于搜索功能的扩展,还是它将彻底改变信息检索的方式?
谢尔盖·布林:AI 的影响远不止于搜索,它几乎触及到生活的各个方面。以编程为例,现在的编程方式与以往相比发生了巨大变化。编写代码变得更具挑战性,尤其是当我们有 AI 可以辅助完成任务时更是如此。
主持人:你每天在公司具体会做些什么?
谢尔盖·布林:实际上,我自己也会编写一些代码,但这纯粹是为了娱乐,出于个人兴趣。有时我会让人工智能帮我编写代码,这过程十分有趣。
举个例子,我曾想测试我们的 AI 模型(Gemini)在数独游戏上的表现。于是,我让 AI 模型自行编写了一系列代码,这些代码能够生成数独谜题,并将其输入到 AI 中进行解答和评分等操作。
我当时与工程师们讨论了这个想法,并进行了几次辩论。大约半小时后,我回来发现 AI 已经完成了任务。工程师们对此却感到惊讶 ——因为实际上他们在编码时并未像我认为应该的那样充分利用 AI 工具。
主持人:这是一个有趣的例子。现在有很多不同的模型,或许某个模型特别擅长解决数独问题、某个模型可以回答关于世界事实的问题、某个模型能够设计房屋……而许多团队正在努力开发一个通用的语言模型。
那么,这是未来的方向吗?有些人提出存在一个“上帝模型”,即一个全能的模型。这是因为如果能够构建出这样一个模型,就意味着实现了通用人工智能(AGI)。那么,AI 的现实是否是由许多专用于特定应用的小型模型组成,并在 AI 智能体中协同工作?此外,模型开发的演进路径又是什么,这些模型最终将如何被用来实现这些令人惊叹的任务?
谢尔盖·布林:回顾过去的 10 至 15 年,不同的 AI 技术被应用于完全不同的问题。例如,用于下棋的 AI 与用于图像生成的 AI 完全不同,后者又与其它类型的 AI 不同。
主持人:就像最近,谷歌的图神经网络(GNN, Graph Neural Network)模型在物理预测模型上的表现超越了所有其他模型一样。你们发布的这项成果令人印象深刻。
谢尔盖·布林:这真是太棒了 —— 我有点不好意思说 —— 我不知道这件事。
主持人:那是一个全新的系统。它的架构和训练方法和以往完全不同,并在特定任务上表现出色。
谢尔盖·布林:历史上,我们总是打造不同的系统。即使是在最近,比如在国际数学奥林匹克竞赛中,我们的模型获得了银牌,实际上仅差一分就能获得金牌。在那次竞赛中,我们部署了三种不同的 AI 模型。其中一个是非常形式化的定理证明模型,事实上,这个模型的表现最佳。另一个则是专门针对几何问题的模型,你可能难以置信,这实际上是一种专用的 AI。还有一个则是通用的语言模型。
那是几个月前的事了,自那之后,我们一直在总结经验。我们正尝试将形式证明者的一些知识和能力融入到我们的通用语言模型中,这件事仍在进行中。
但我确实认为,当前的趋势是朝着更统一的模型发展。虽然我不确定是否应该称之为“上帝模型”,但未来的确需要某种共享架构,最终甚至可能是共享模型。此外,显然需要大量的计算资源。我记得读过一些论文,它们推测未来的计算需求可能会达到 100 兆瓦、1 吉瓦、10 吉瓦乃至 100 吉瓦,但我不确定这种程度的外推是否完全可信。部分原因是,近年来算法的改进可能甚至超过了模型计算能力增长带来的影响。
主持人:那业界如今正在进行的大规模建设是否显得不理智?大家都在谈论英伟达(NVIDIA)的收入、利润和市值,以及支持所有所谓的超大规模计算提供商和基础设施的增长,这些都是为了构建当前技术所需的超大规模模型。这种扩张是不理智的豪赌,还是说有迹可循?
谢尔盖·布林:首先,我不是经济学家,也没有像你们那样密切跟踪公司的市场动态。因此,我的专业知识在这方面有所局限。
在我看来,由于谷歌面临巨大的需求,所以我们正在尽可能快地扩大计算能力。
例如,我们的云客户需要大量的 TPU 和 GPU,而由于缺乏足够的计算资源,我们有时不得不拒绝客户 —— 毕竟谷歌内部也需要这些资源来训练和运行我们自己的模型。因此,我认为这些公司迅速扩张计算能力是有充分理由的。然而,我不确定是否应该根据现有的训练趋势盲目地推断未来的发展。当前企业的需求确实存在,并且十分明显。无论是在运行这些 AI 模型上执行推理,还是将它们应用于新应用中,需求都没有上限。
主持人:在模型应用方面,无论是在机器人技术还是生物学领域,你看到了哪些最显著的成功,那些让你感到惊讶的成功?有哪些事例会让你觉得“哇,这真的有效”,又有哪些可能更具挑战性,比某些人预期的花费更多时间?
谢尔盖·布林:既然你提到了这个话题,那么我得说,谷歌的 AlphaFold 已经在生物学领域应用了一段时间。虽然我不是生物学家,但当我与生物学家交流时,发现他们都在使用 AlphaFold 及其最新版本。我认为所有这些技术都在逐渐融合。
对于大多数机器人技术,我认为它们仍处于所谓的“哇哦”阶段。比如,你能够让机器人仅通过这个通用语言模型,或仅需少许调整,就能完成某些任务。然后展示出来,让不明真相的路人一片哗然:“哇哦,真牛逼!” —— 但在大多数情况下,它们还未达到能够在日常生活中可靠使用的稳健程度。
主持人:但你看到了机器人的潜力?
谢尔盖·布林:我确实没看到这项技术面临着任何特别的阻碍。
主持人:Google 曾经有过机器人业务,后来你们剥离或出售了它。
谢尔盖·布林:我们曾经拥有五六项机器人业务。
主持人:那会儿时机未到。
谢尔盖·布林:不幸的是,我们放弃得有点太早了。说来惭愧,但它们都非常酷,给人留下了深刻印象。看看现在这些通用语言模型,不仅包含视觉和图像,而且是多模态的,能够理解场景。而在那时,这些技术还不存在,一切都很落后,没有现代 AI 技术的支持,简直就像是在一台不会前进的跑步机上跑步。
主持人:你在核心技术上投入了大量时间。那么,在产品愿景方面,你也花费了许多心思吗?你是如何看待未来的发展趋势的?在一个人工智能无处不在的未来世界里,人机交互模式将呈现怎样的形态?
谢尔盖·布林:你是在询问我们的生活方式将会如何变化吗?这个话题通常在休息期间会被非正式地讨论。我的看法不多,也许是更多的社交互动?预测五年后的状况确实极具挑战性,因为人工智能基础技术的能力决定了应用的可能性。有时,某个人可能会展示一个小的原型(demo),而这可能会带来意想不到的惊喜。但从原型到实际产品,则需要时间。你体验过Astra 模型(Google Deepmind 的实验性多模态 AI 项目)吗?它可以实现实时的视频和音频处理,允许用户与人工智能进行对话,讨论周围环境中的事物。
主持人:我没体验过,你会给我访问权限吗?
谢尔盖·布林:当然 —— 等我先获得了权限再说。说实话,我通常是最后一个接触到这些新技术的人。
总之,确实会有一刻让你感到震撼,你会感叹:“哇,这太神奇了。”紧接着你会思考:“好吧,虽然它在 90% 的时间内运作正常,但如果剩下的 10% 时间内出现问题或反应迟缓,这是否值得?” 然后我们就必须持续努力,不断改进这些功能,提高响应速度,增强用户体验。最终,我们确实能够创造出一些令人惊叹的产品。
主持人:我听说有一次你到公司的时候,一群工程师向你展示了如何利用人工智能编写代码。他们表示尚未将其整合到 Gemini 中,因为希望确保其稳定性。在 Google 内部似乎对此有所顾虑。但你却表示,如果它能够编写代码,就应该推动该项目。很多人讲过这个故事,因为他们认为,从你这位创始人那里得到这样的明确支持至关重要,表明 Google 的谨慎态度不应成为阻碍,我们需要看到 Google 推陈出新。这个说法准确吗?这是你近期关注的重点吗?随着 Google 的不断壮大,是否担忧也随之增加?
谢尔盖·布林:我认为,公司内部确实存在一些顾虑,或者说是谨慎的态度……首先,谈到大语言模型,它基本上是通过我们在六至八年前发表的 Transformer 论文所开创的。顺便提一句,Noam(Transformer 作者之一)现在又回到了谷歌,这真是太好了。
的确,在部署这些模型时我们显得过于谨慎,但其中有许多合理的理由,例如它们可能会犯错误,有时还会说出一些令人尴尬的话。它们有时表现出来的笨拙程度甚至会让使用者感到难堪,即使是现在最先进的系统也会犯一些普通人绝不会犯的愚蠢错误。然而,它们同样具备令人难以置信的能力,比如能够帮助你完成以前未曾尝试过的任务。我曾和孩子们一起编写了一些复杂的程序,他们只需要向人工智能提出问题,就能够利用那些复杂的 API 和通常需要一个月学习的技术来编程。我认为这种能力如同魔法一般,只是需要用户愿意承担一定的尴尬和风险。我认为在这方面我们已经有了进步,毕竟你们已经看过更多的翻车现场了。(前段时间的,Gemini Nano 在三星手机上的演示出现了三次失误)
主持人:但你对此感到坦然,也就是说,尽管你持有超级投票权的股票,你在这个阶段仍不介意这些尴尬的翻车演示发生 —— 因为你认为这样做至关重要?
谢尔盖·布林:这和我的权利没什么关系,我们只是在向世界传递一种神奇的东西,所以只要我们能够正确地传达这一点,比如,“看,这项技术虽然神奇,但我们偶尔会犯一些大错”,那么我们就应该将其公之于众,让人们去试验,探索其潜在的新用途。我认为,这并不是一种应该被紧紧攥在手中、直至完美才展示的技术。
主持人:那你是否认为人工智能可以影响的领域众多,并且能够创造如此多的价值,以至于这不仅仅是一场谷歌、Meta 和亚马逊之间的竞赛?当前存在如此多的价值有待创造,以至于你正在研究许多不同的机会,而这些机会并不完全取决于谁建立了性能最优的模型或是得分最高的大语言模型?你是如何看待外部世界以及谷歌在其中的角色?
谢尔盖·布林:我认为竞争是有益的,因为它激励着所有公司在这一领域争先恐后地进步。顺便提一下,我们最近在 LMSYS(一个用于评估人工智能模型的基准测试)上连续几周排名首位。而且据我上次查看时,我们依然领先于顶尖模型。当然,这里涉及一些 ELO 评分系统方面的考量。
主持人:所以你确实很在意这些事啊!
谢尔盖·布林:(笑声)我并非是在炫耀。但我们确实取得了很大进展,相比于几年前 ChatGPT 推出时我们落后的局面,我对我们在各个领域取得的所有进展感到非常自豪。因此,我们确实非常重视 AI 领域。我认为,有许多人工智能公司存在是一件好事,无论是我们、OpenAI、Anthropic 或是其他公司,还有 Mistral,这是一个快速发展且充满活力的领域,我认为这对人类有着巨大的价值。
如果回想一下,比如在我上学的那个年代,那时还没有真正的互联网或像我们今天所熟知的那种网络。获取基本信息需要付出极大的努力;在没有手机和其他设备之前,与他人沟通也是一项艰巨的任务。如今,我们全球范围内获得了如此多的能力。而新兴的人工智能则代表了另一项巨大的能力。现在,世界上几乎每个人都可以以某种形式接触到它,这非常令人振奋。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.