主讲人:吴恩达
吴恩达: 真的很高兴见到大家。今天,既然是 AI 创业学校,我想和你们分享一些我在 AI Fund 做创业孵化时学到的经验。AI Fund 是一家创业工作室,我们平均每个月都会孵化一家新公司。因为我们是联合创始人,所以我们在那里写代码、和客户交流、设计功能、确定定价。因此,我们积累了大量的实践经验,不仅仅是看别人创业,而是真正地身陷其中,和创业者们一起在“杂草丛”里摸爬滚打。今天,我想和你们分享一些我在创业过程中学到的教训,特别是围绕不断变化的 AI 技术及其带来的可能性。这次分享的核心主题是 速度 。
事实证明,对于那些想创业的人来说,我认为一个能强烈预测创业成功几率的指标就是 执行速度 。我其实非常敬佩那些做事情特别快的创业者和高管。新的 AI 技术正让初创公司能够跑得更快。所以,我希望与大家分享一些最佳实践——坦率地说,这些实践每两三个月仍在变化——以帮助你们获得那种速度,从而有望提高你们的成功几率。
吴恩达: 在深入讨论速度之前,很多人问我:“嘿,Andrew,创业的机会在哪里?” 这就是我眼中的 AI 技术栈:最底层是半导体公司,在其之上是作为超大规模算力提供方的云服务商。再往上,是很多 AI 基础模型公司。尽管许多公关热点和炒作都集中在这些技术层上,但事实证明,几乎从定义上讲, 最大的机会必须在于应用层 。因为我们实际上需要应用来产生更多的收入,这样它们才能有足够的资金去支付基础模型、云服务和半导体技术层的费用。所以,无论出于什么原因,媒体和社交媒体通常不太谈论应用层,但对于那些想从事创业的你们来说,几乎可以肯定,最大的机会一定在那里,当然,技术栈的每一层也都有机会。
吴恩达: 过去一年里,AI 技术趋势变化很大。如果你问我 AI 领域最重要的技术趋势是什么,我会说是 代理式 AI 的兴起。大约一年半以前,当我开始四处演讲,试图说服人们 AI 代理可能会成为一个重要方向时,我并没有意识到,大概在去年夏天,一群营销人员会抓住这个词,把它像贴纸一样贴在所有能看到的东西上,这几乎让这个词失去了一些本意。但我想从技术角度和你们分享一下,为什么我认为代理式 AI 令人兴奋且重要,并且它也开启了更多的创业机会。
吴恩达: 事实证明,我们很多人使用大语言模型的方式是给它一个提示,让它生成输出。我们让大模型输出内容的方式,就像是你去找一个人——或者说在这个情况下是一个 AI——要求它从头到尾一次性打完一篇完整的文章,而且全程不能使用退格键。我们人类,在被迫用这种线性方式写作时,是无法展现出最佳水平的。事实证明,AI 也不行。尽管被迫以这种线性方式写作有诸多困难,我们的大语言模型做得还是出奇地好。
吴恩达: 有了代理式工作流,我们可以让 AI 系统先去写一个文章大纲,如果需要的话,做一些网络研究,抓取一些网页放入自己的上下文中,然后写一个初稿,接着阅读初稿、提出批评,再进行修改,如此反复。这样,我们就有了一个迭代式的工作流,你的模型会进行一些思考、研究,进行修改,再回过头来做更多的思考。通过多次循环这个过程,虽然速度会慢一些,但它能交付一个质量好得多的工作成果。
吴恩达: 所以,对于 AI Fund 做过的很多项目,从提取复杂的合规文件,到医疗诊断,再到推理复杂的法律文件,我们发现,这些代理式工作流真的是决定一个项目“行”还是“不行”的关键区别。但很多需要完成的工作,很多有待建立的、有价值的企业,仍然需要我们采用现有或新的工作流程,并想办法将它们实现为这些代理式工作流。
吴恩达: 更新一下这幅 AI 技术栈的图。过去一年中出现的新事物,是一个 代理编排层 ,它帮助应用开发者编排或协调对下层技术的多次调用。好消息是,这个编排层让构建应用变得更加容易。但我认为,那个基本结论——应用层必须是这个技术栈中最有价值的一层——在偏向或专注于应用层的前提下,依然成立。
吴恩达: 现在,让我深入分享一些我学到的关于初创公司如何能更快行动的最佳实践。在 AI Fund,我们只专注于具体的想法。对我来说,一个具体的产品想法,是指其详细程度足以让一名工程师直接动手去实现。比如,如果你说“让我们用 AI 来优化医疗资产”,那其实不是一个具体的想法,它太模糊了。如果你告诉我,用某款软件通过 AI 优化医疗资产,不同的工程师会做出完全不同的东西。因为它不具体,你就无法快速构建,也就失去了速度。
吴恩达: 相反,如果你有一个具体的想法,比如“让我们编写软件,让医院能为病人提供在线预约 MRI 机器的服务,以优化其使用率”。我不知道这是不是一个好或者坏的具体想法——事实上已经有公司在做这个了——但它是具体的,这意味着工程师可以快速开发。如果它是个好想法,你会发现它是好的;如果它不是个好想法,你也会发现。拥有具体的想法能为你赢得速度。再比如有人说:“让我们用 AI 提升邮件个人效率。” 这有太多种解读了,这不具体。但如果有人说:“你能不能在 Gmail 里集成一个自动化功能,使用恰当的提示词和过滤器来整理所有邮件?” 那就是具体的,我今天下午就能去写出来。
吴恩达: 具体性为你赢得速度。而对很多创业者来说,具有欺骗性的一点是,模糊的想法往往会得到很多赞誉。如果你去告诉你的朋友们:“我们应该用 AI 来优化医疗资产的使用。” 每个人都会说:“那是个好主意。” 但它其实并不是个好主意,至少从“可以着手构建”这个意义上不是。事实证明,当你的想法模糊时,你几乎总是对的。但当你的想法具体时,你可能对,也可能错。哪一种结果都可以,我们能更快地发现结果,这对初创公司来说才是最重要的。
吴恩达: 在执行具体想法时,在 AI Fund,我要求团队专注于具体的想法,因为一个具体的想法能提供清晰的方向,团队就能跑得非常快,去构建它,要么验证它、证明它可行,要么证伪它、得出不可行的结论。哪种结果都行。这样我们就能快速行动。而且事实证明,找到一个好的具体想法,通常需要某个人——可能是你,也可能是一位领域专家——对一个问题进行长时间的思考。例如,在创办 Coursera 之前,我花了好几年的时间思考在线教育,与用户交流,沉淀我自己关于什么才是好的教育科技平台的直觉。经过那个漫长的过程——YC 有时称之为“在想法迷宫中徘徊”——在对某件事深思熟虑很长时间之后,你会发现,那些长期思考过这个问题的人的直觉,在快速决策时可以非常出色。在你长时间思考并和客户交流之后,如果你问这个专家:“我应该做这个功能还是那个功能?” 他们的直觉——那种瞬间做出的决定——实际上可以是一个非常准确的代理,一个出奇有效的决策机制。
吴恩达: 我知道我是做 AI 的,你可能会觉得我会说“哦,我们需要数据”。当然,我热爱数据,但对于很多初创公司来说,获取数据来做决策其实是一种很慢的机制。而一个拥有良好直觉的领域专家,往往是做出快速决策的更好方式。另外一点是,对于很多成功的初创公司,在任何一个时间点,你们都是在追求一个非常明确的假设,开发并努力把它卖出去,验证其价值。一家初创公司没有资源去对冲风险,同时尝试十件事情。所以, 选择一个方向,全力以赴 。如果数据告诉你,应该对这个想法失去信心,那也完全没问题,立刻转向,去追求一个完全不同的具体想法。
吴恩达: 这就是在 AI Fund 经常发生的情况。我们坚定不移地追求一件事,直到世界告诉我们错了,然后我们立刻改变方向,以同样的决心和坚持去追求一件完全不同的事。我看到的另一个模式是,如果每一条新数据都让你转向,那可能意味着你的知识基础太薄弱了。如果每次你和客户聊完,就彻底改变主意,那可能意味着你对该领域的了解还不足以产生一个真正高质量的具体想法。找到一个对该领域思考时间更长的人,可能会让你走上一条更快的正轨。
吴恩达: 我常常思考的另一件事是“构建-反馈循环”,随着我们用 AI 辅助编程,这个循环正在发生快速变化。当你在构建很多应用时,最大的风险之一是 用户接受度 。很多初创公司之所以挣扎,不是因为我们不能构建出我们想做的任何东西,而是因为我们做出来之后,发现根本没人在乎。所以,对于很多创业项目——尤其是应用层项目,而不是深度科技或底层技术项目——我们通常这样运作:先开发软件,这是一个工程任务;然后我们从用户那里获取反馈,这是一个产品管理任务;接着,根据用户反馈,我们调整对“该做什么”的想法,再回去写更多的软件。我们一次又一次地循环这个过程,不断迭代,直到找到产品市场契合点。事实证明,随着 AI 编码辅助——安德烈也谈到了这一点——快速工程化正在以一种以前根本不可能、而现在却非常可行的方式成为现实。所以,工程化的速度正在飞速提升,工程化的成本也在飞快下降。这改变了我们推动初创公司在这个循环中运转的机制。
吴恩达: 当我在思考自己所做的软件时,我可能会把它分成两大类。有时,我会构建快速且粗糙的原型来测试一个想法。比如说,做一个新的客服聊天机器人,或者开发 AI 去处理法律文件,我们搭一个快速且粗糙的原型,看看我们觉得它是否可行。另一种我要做的软件,是编写可维护的生产级软件、维护遗留代码库,就是那种庞大的、可用于生产环境的代码库。根据不同的分析师报告,很难在这方面找到非常严谨的数据。在编写生产级质量的代码时,使用 AI 系统可能会让我们快 30% 到 50%。很难找到一个精确的数字,但大概在这个范围是合理的。但在构建快速且粗糙的原型方面,我们不是快了 50%,我认为我们至少快了 10 倍,甚至远远超过 10 倍。这背后有几个原因。
吴恩达: 当你构建一个独立原型时,它较少需要与遗留软件基础设施和遗留数据进行集成。另外,对可靠性、可扩展性甚至安全性的要求也低得多。我知道我不应该告诉人们去写不安全的代码,这感觉像是错误的话。但我经常对我的团队说:“大胆去写不安全的代码。” 因为如果这个软件只会在你的笔记本电脑上运行,而你自己不打算恶意攻击自己的电脑,那有不安全的代码也没关系,对吧?当然,在它看起来可行之后,请一定要在交付给其他人之前,把它变得安全。你知道,一个泄露 API 密钥、泄露敏感数据的漏洞,是非常有害的。所以,在发布之前,确保它是安全且可扩展的,但在测试阶段,没关系。
吴恩达: 我发现,越来越多的初创公司会通过构建 20 个原型来看哪个可行,从而系统性地追求创新。我知道人们对 AI 有些焦虑,很多概念验证(POC)最终都没能上线。但我认为,通过把概念验证的成本降得足够低,大量概念验证没能见到天日其实也没什么。我知道“快速行动,打破常规”这句口号名声不太好,因为它确实打破了一些东西。有些团队从中得到的教训是“你不应该快速行动”,但我认为这是错误的。我倾向于告诉我的团队:“ 快速行动,但要负责任 。” 我认为,实际上有很多方法可以在保持负责任的同时,做到行动非常迅速。
吴恩达: 在 AI 辅助编码领域,大概三四年前,由 GitHub Copilot 普及了代码自动补全。然后出现了以 Cursor、Windsurf 为代表的新一代 AI 驱动的集成开发环境,我很常用 Windsurf 和 Cursor。接着,大概六七个月前,开始出现新一代、高度代理化的编码助手,包括现在非常多人用来做编程的 o3。Claude Code 非常棒,自从Claude 4 发布以来,它变得……过几个月再问我,我可能会用别的。这些工具演化得极其迅速,但我认为 Claude Code 是那种高度代理化的新一代编码助手,它让开发者的生产力持续增长。有意思的是,比起紧跟最新工具的人,哪怕你只落后了半代或一代,差距也会非常巨大。我发现,我的团队现在采取的软件工程方法,和三个月甚至六个月前相比,已经完全不同了。
吴恩达: 一件令人惊讶的事情是,我们过去习惯了把代码视为一种真正有价值的资产,因为它太难创造了。但因为软件工程的成本正在下降,代码作为资产的价值远不如前了。所以,我所在的团队上个月把整个代码库重写了三遍,这都没什么,因为现在已经不那么难了。选一个新的数据架构,也没什么大不了,因为这样做的成本已经骤降了。
吴恩达: 你们有些人可能听过杰夫·贝索斯关于“双向门”和“单向门”的说法。一个“双向门”决策,是指你做了决定后,如果改变主意,可以相对廉价地退回来、撤销它。而“单向门”是指,你做了一个决定后,要改变主意成本极高,或者极难逆转。选择你技术栈的软件架构,过去就是一个“单向门”。一旦你在某个技术栈上构建了东西,设定了数据库架构,就很难去改变它。所以,那曾经是一个“单向门”。我不想说它现在已经完全成了一个“双向门”,但我发现我的团队经常会在一个技术栈上构建一周后,改变主意,说“让我们把代码库扔掉,在一个新的技术栈上重新来过”。
吴恩达: 我不想过度夸大,我们并不总是这样做。重做仍然是有成本的。但我发现我的团队经常在重新思考,什么才是单向门,什么已经变成了双向门,因为软件工程的成本现在真的低了很多。也许我们可以稍微跳出软件工程来看,我觉得现在确实是赋能每个人用 AI 去创造的好时机。
吴恩达: 过去一年里,有一些人建议人们不要学编程,理由是 AI 会自动化掉编程。我认为未来我们回头看,这会是有史以来最糟糕的职业建议之一。因为当更好的工具让软件工程变得更容易时,应该有更多人去做这件事,而不是更少。几十年前,当世界从打孔卡转向键盘和终端时,这让编程变得更容易。当我们从汇编语言转向像 COBOL 这样的高级语言时,事实上当时就有人争论说,现在我们有了 COBOL,就不再需要程序员了。人们甚至为此写了论文,但那当然是错的。编程语言让编程变得更容易,于是更多人学会了编程。GitHub Copilot 是 AI 编码助手。随着编程变得越来越容易,应该有更多人学习编程。我有一个有争议的观点,那就是,我认为现在是时候让 每个岗位上的每个人都学会编程 了。事实上,在我的团队里,我的 CFO、我的招聘主管、我的招聘专员、我的前台,他们全都会写代码。而且我实实在在地看到,他们因为会写代码,在他们各自的岗位上都表现得更好。我想我可能有点超前,可能大多数企业还没到这一步。但在未来,我认为我们能让每个人都学会编程,很多人可以因此变得更有生产力。
吴恩达: 我还想分享一个我学到的经验,关于为什么应该让人们学习做这件事。当我在 Coursera 上教授《面向所有人的生成式 AI》时,我们需要用 Midjourney 生成像这样的背景图。我的一个团队成员懂艺术史,所以他能够用艺术流派、调色板、艺术灵感来设计给 Midjourney 的提示词。他对自己生成的图像有非常好的控制力。所以我们最终用了很多 Tommy 生成的图片。而相比之下,我不懂艺术史。所以当我输入提示词来生成图像时,我只能写“请为我生成漂亮的机器人图片”,我永远无法拥有我同事那样的控制力,所以我无法生成像他那么好的图片。我认为,对于计算机来说,未来最重要的技能之一,就是 向计算机精确描述你想要什么并让它为你执行的能力 。而那些对计算机有更深理解的人,将能够指挥计算机得到他们想要的结果。而学习编程——不一定是你自己亲手写代码,而是能引导 AI 为你写代码——似乎将在很长一段时间内,仍然是做到这一点的最佳方式。
吴恩达: 随着软件工程变得快得多,我观察到的另一个有趣动态是,产品管理的工作——获取用户反馈、决定要开发哪些功能——越来越成为瓶颈。在过去一年里,我在很多团队中都看到了非常有趣的动态:越来越多的团队开始抱怨,他们的瓶颈在于产品、工程和设计,因为工程师们变得太快了。我观察到一些有趣的趋势:三、四、五年前,硅谷有一些不太靠谱但依然流传的经验法则,比如一名产品经理对应四名工程师,或者一名产品经理对应七名工程师。我们对此持保留态度,但它通常是一名产品经理对应六到七名工程师。随着工程师变得非常快,我并没有看到产品管理工作——也就是设计该做什么——以和工程师同样的速度在变快。我发现这个比例正在发生变化。就在昨天,我的一个团队来找我,当我们在为一个项目规划人员编制时,这个团队首次向我提出的不是一名产品经理对四名工程师,而是 1 名产品经理对应 0.5 名工程师 。所以这个团队实际上向我提议——我至今仍不知道这是否是个好主意——我生平第一次看到,管理者向我提议让产品经理的数量是工程师的两倍。这是一个非常有趣的动态。我仍然不知道我听到的这提议是不是好主意,但我认为它是世界走向的一个信号。而且我发现,那些会写代码的产品经理,或者有一定产品直觉的工程师,通常最终会做得更好。
吴恩达: 我发现对于创业领袖来说,另一件重要的事情是:因为工程进展如此之快,如果你有好的策略来获得快速反馈,以更快地形成你对于“该做什么”的认知,这也能帮你变得更快。我将介绍一系列获取产品反馈的策略,这些策略有助于你不断修正你决定构建的东西。我们会按照从较快但可能不太精确,到较慢但更精确的顺序来过一遍。
吴恩达: 最快的获取反馈策略是 自己看产品,凭直觉判断 。如果你是一位领域专家,这个方法其实出奇地好,前提是你真的懂行。稍微慢一点的是, 问问三个朋友或团队成员 ,让他们试用你的产品并获取反馈。再慢一点是, 找三到十个陌生人 获取反馈。当我做产品时,我发现我学到的最重要技能之一,就是如何坐在咖啡店里,如何在旅行时坐在酒店大堂里。我发现,学会识别那些人流量高的地方,然后非常有礼貌地拉住陌生人,请他们对我正在做的东西给点反馈——这在我知名度不高的时候更容易。当人们认出你时,会稍微有点尴尬。我其实和团队一起坐在酒店大堂里,那里人流量极高,非常有礼貌地问陌生人:“嗨,我们正在做这个东西,你介意看一眼吗?” 我实际上在一个咖啡店里发现,很多人在那里工作,其中很多人其实不想工作。所以我们给他们一个分心的借口,他们也非常乐意这样做。我确实和合作者们就这样在酒店大堂或咖啡店里,做出了无数个产品决策。 把原型发给 100 个测试者 。如果你能接触到更大的用户群,就发给更多用户。这些策略执行起来越来越慢。我知道在硅谷,我们喜欢谈论 A/B 测试,我当然也做大量的 A/B 测试。但与很多人想的不同的是,A/B 测试现在是我菜单里最慢的策略之一,因为把它发布出去本身就很慢。是的,这也取决于你拥有多少用户。
吴恩达: 另外,当你使用除第一种策略之外的任何策略时,有些团队会看看数据,然后做出决定。但容易被忽略的一点是:当我进行 A/B 测试时,我不仅仅是使用 A/B 测试的结果来选产品 A 或产品 B。我的团队经常会坐下来,仔细研究数据,来打磨我们的直觉,以加快速度、提高成功率。我希望我们能达到能用第一种策略做出高质量决策的程度。我经常会坐下来想:“天哪,我本以为这个产品名会比那个产品名效果好。显然,我对于用户的心智模型是错的。” 真正坐下来思考,利用所有数据来更新我们的心智模型,从而提高我们凭直觉快速做出产品决策的质量,这被证明是非常重要的一点。
吴恩达: 好了,我们讨论了具体的想法、加速工程和加速产品反馈。我还想提最后一点,那就是我发现 理解 AI 本身会让你走得更快 。原因如下。作为一个 AI 人,我的观点可能有偏向,但我想和你们分享原因。对于像移动端这样的成熟技术,很多人拥有智能手机已经很长时间了,我们大概知道一个移动 App 能做什么。所以很多人,包括非技术人员,对于一个移动 App 能做什么都有很好的直觉。如果你去看像销售、市场、人力资源、法务这类成熟的岗位,它们都很重要,也很难。但因为做市场营销的人已经有足够多的人干了足够久,而且市场营销的策略在过去一年也没发生那么大的变化,所以有很多人真的非常擅长市场营销。它很重要,也很难,但那方面的知识是相对普及的,因为你知道,怎么做人力资源的知识——它近六个月来并没有发生戏剧性的巨变。但 AI 是一项 新兴技术 。所以,如何真正把 AI 做好的知识,目前并不普及。因此,那些真正懂行、理解 AI 的团队,确实比不懂的团队更有优势。如果你遇到一个人力资源问题,你很可能会找到懂得如何做好的人。但如果你遇到一个 AI 问题,知道如何真正去解决它,可能会让你领先于其他公司。比如,客服聊天机器人的准确率能达到多少?你应该使用提示词、微调还是工作流?如何让语音获得低延迟?有很多这样的决策,如果你做出正确的技术决策,你可能在几天内就解决问题;如果你做出错误的技术决策,你可能会在一条死胡同里追三个月。有一件让我感到惊讶的事:如果你有两个可能的技术架构选择,这相当于一个比特的信息量。你可能会感觉,如果你不知道正确答案,你最多就是慢两倍,对吧?一个比特嘛,两个都试试。感觉上,一个比特的信息最多能带给你两倍的速度提升。从某种理论意义上说,这是对的。但我在实践中看到的是,如果你选错了那个比特,你不是慢两倍,而是花上十倍的时间去追一条死胡同。这就是为什么带着正确的技术判断进入赛道,真的能让初创公司跑快得多。
吴恩达: 我发现密切关注 AI 对初创公司非常有帮助的另一个原因是,在过去两年里,我们拥有了大量出色的生成式 AI 工具,或者说生成式 AI 的“积木块”。这份清单很不完整:提示词、工作流、评估、护栏、检索增强生成、语音、异步编程、大量的 ETL、嵌入、微调、图数据库、如何集成模型。我们有一份长长的、精彩的积木块清单,可以快速组合,从而构建出地球上一年前还没有人能构建出的软件。这为创业公司创造了大量构建新事物的机会。当我学到这些积木块时,我脑海中浮现的实际上是这幅画面。如果你只拥有一块积木,比如你有一个基础的白色积木块,没错,你可以搭建一些挺酷的东西。也许你知道如何做提示词,所以你有一块积木,你可以搭建一些令人惊叹的东西。但如果你拿到第二块积木,比如你也知道如何构建聊天机器人,那么你就有了一个白色乐高积木和一个黑色乐高积木,你能搭建出更有意思的东西。如果你又获得一个蓝色的积木块,你能搭建出更有意思的东西。拿几块红的,再加上一小块黄的,更有意思了。得到更多的积木块,再得到更多的积木块,很快,你能组合出的东西的数量会呈组合式,或者说呈指数级增长。所以,了解所有这些精彩的积木块,能让你以丰富得多的方式去组合它们。
吴恩达: DeepLearning在做的其中一件事就是——其实我自己也上很多 DeepLearning的课程,因为我和很棒的团队一起工作——我们基本上和世界上所有领先的 AI 公司都有合作,并试图把“积木块”递给大家。当我去看 DeepLearning的课程目录时,这其实就是我看到的东西。每当我学习这些课程来掌握这些积木块时,我都感觉自己在获得新东西,它们可以组合成数量呈指数增长的软件应用,而所有这些在一两年前都还是不可能的。
吴恩达: 总结一下,这是我的最后一张幻灯片。如果你们有任何问题,我很乐意回答。我发现,对初创公司来说,很多因素都很重要,不仅仅是速度。但当我去看 AI Fund 正在孵化的那些初创公司时,我发现管理团队 以极快速度执行的能力 与其成功几率高度相关。我们学到的一些关于赢得速度的经验是:首先, 致力于具体的想法 。必须是好的具体想法。我发现,作为一名管理者,别人评判我是看我的决策速度和决策质量。两者都很重要,但速度绝对是至关重要的。其次,借助 AI 编码辅助进行 快速迭代 ,能让你快得多。但这会把瓶颈转移到获取用户对产品决策的反馈上。因此,要拥有一系列策略去 获取快速反馈 。如果你还没学会去咖啡店和陌生人交谈,这并不容易,但一定要保持尊重,对吧?对人保持尊重,我认为这实际上是创业者需要具备的一项极其宝贵的技能。最后,我认为 紧跟技术的发展 也能为你赢得速度。
好了,就到这里。非常感谢大家。很高兴回答你们的问题。
Q&A环节
同学提问 : 随着 AI 的进步,你认为对人类来说,是开发工具更重要,还是学会如何更好地使用工具更重要?在一个智能正变得普及的世界里,我们该如何定位自己以保持不可或缺?
吴恩达: 我觉得 AGI 被过度炒作了。在很长一段时间内,仍然会有很多人类能做而 AI 做不到的事情。我认为在未来,最强大的人是那些能让计算机精确执行他们意愿的人。所以,我认为紧跟工具的发展——我们中的一些人会去开发工具,但别人会开发很多其他我们可以直接使用的工具——那些知道如何用 AI 让计算机达成他们目的的人,会变得强大得多。不用担心人类会无事可做,但能够使用 AI 的人,会比那些不使用的人强大得多。
同学提问 : 非常感谢。我对您怀有极大的敬意,您是我们很多人真正的榜样。我的问题是关于计算的未来。随着我们迈向更强大的 AI,您认为计算的发展方向在哪里?我们听到有人说要把 GPU 送到太空,有人在讨论核电数据中心。您对此怎么看?
吴恩达: 我正好想结合上一个关于 AGI 的问题来回答。实际上有一个框架可以帮助你判断什么是炒作,什么不是。在过去两年里,有少数几家公司出于推广、公关、融资、影响力等目的,大肆炒作某些概念。因为 AI 太新了,几乎没有多少人能对这些公司说的话进行事实核查,所以他们就几乎可以随意地说任何话。我心中的一个过滤器就是:有一些被放大的炒作叙事,是为了让这些公司显得更强大。比如,“AI 太强大了,我们可能不小心导致人类灭绝”——这太荒谬了。但这是一种炒作叙事,它让某些公司显得更强大,并且被大肆传播,实际上也帮助了某些公司达成其融资目标。“AI 如此强大,很快就不会再有人有工作了”——这根本不是事实。但同样,这让这些公司显得更强大,被炒起来了。还有“我们如此强大,训练一个新模型就能随便消灭成千上万家初创公司”——这也不是真的。是的,Jasper 曾经遇到麻烦,也有少数公司被淘汰了,但随便消灭成千上万家初创公司没那么容易。“AI 需要如此多的电力,只有核能才够用”,你们都知道,什么风能、太阳能,不,那都不是真的。所以我觉得,所谓 GPU 要上太空,我不知道,去试吧。我认为我们的地面 GPU 还有很大的发展空间。我觉得一些被放大的炒作叙事,是对未来真实情况的一种严重扭曲。
同学提问 : AI 领域有很多炒作,没有人真正确定我们将如何用它来构建未来。但您看到哪些最危险的偏见或被过度炒作的叙事,是人们常谈论并被其误导,以至于一条道走到黑,而我们应该尽力避免或更加警觉的?这样我们才能在构建未来时拥有更现实的观点。
吴恩达: 我认为“AI 危险”的叙事被过度炒作了。AI 是一个极好的工具,但就像任何其他强大的工具,比如电,有很多方式可以用于有益的目的,也有一些方式可能被用于有害的用途。我发现自己不常使用“AI 安全”这个词了。不是因为我们应该制造危险的东西,而是因为我认为 安全不是技术的属性,而是我们如何应用它的属性 。就像一个电动马达,制造商无法保证没有人会以不安全的下游方式使用它。马达可以被用来制造榨汁机,可以被用来制造智能炸弹,但电动马达制造商无法控制它在下游被如何使用。所以,安全不是电动马达的属性,而是你如何应用它的属性。我认为 AI 也是一样。AI 本身既不是安全的也不是不安全的,是你如何使用它,才决定了它是安全还是不安全。所以,与其思考 AI 安全,我更常思考 负责任的 AI 。因为我们是负责任地,还是不负责任地使用它,决定了我们用 AI 技术构建的东西最终是有害的还是有益的。我感觉有时候新闻里炒作的那些非常离奇的边缘案例——好像就在一两天前,有篇《华尔街日报》的文章关于 AI 失控什么的——我觉得那篇文章把实验室里跑的极端案例实验,以一种我认为与其实验极不相称的方式进行了耸人听闻的报道。不幸的是,技术本身就很难理解,很多人无法分辨,所以这些炒作叙事就一直在被放大。而且,我觉得这也被用作攻击开源软件的武器,这非常不幸。
同学提问 : 谢谢您的工作,我认为您的影响是非凡的。我的问题是,作为有抱负的创始人,我们应该如何在一个任何东西都可能一天之内被颠覆的世界里思考商业?不管你有什么伟大的护城河、产品或功能,竞争对手可能用 AI 辅助编程在几小时内就复制出来。
吴恩达: 当你创建一家公司时,有很多事情需要担心。我认为第一要务是: 你是否正在打造一个用户热爱的产品? 当建立一门生意时,有很多要考虑的:市场进入渠道、竞争对手、技术护城河,所有这些都很重要。但如果我只能专注于一件事,那就是:你在打造一款用户真正想要的产品吗?在你解决这个问题之前,建立一个有价值的企业是非常困难的。在解决这个问题之后,其他问题才会真正出现。你有接触客户的渠道吗?长期定价是什么?你的护城河是什么?我发现 护城河通常被过度炒作 了。实际上,我发现更多的生意是从一个产品起步,然后演化,最终才形成护城河。对于消费级产品,品牌多少更有防御力。如果你有巨大的动能,别人会很难追上你。但对于企业级产品,有时护城河可能更多体现在难以进入企业客户的渠道上。所以,不好意思,当 AI Fund 看一个项目时,我们其实会做一个相当复杂的分析,写一份两到六页的叙述性备忘录,来分析这些因素,然后再决定是否继续推进。所有这些都很重要。但我觉得,眼下这个时间点,机会的数量——也就是世界上那些还没有人构建、但可以构建的东西——似乎远远大于拥有相关技能去构建它们的人的数量。所以,至少在应用层,我感觉有大量的空白地带,有很多新东西你可去尝试构建,而且似乎没有其他人在做。我想说, 专注于打造一款人们想要、人们热爱的产品,然后再在过程中解决其他问题 。
同学提问: 教授您好,谢谢您精彩的演讲。我是一名来自斯坦福的 AI 研究员,我觉得您演讲中的比喻非常有趣。您说当前的 AI 工具像积木,并且可以通过累积来搭建。然而,到目前为止,我们很难看到 AI 工具集成带来的累积性功能扩展,因为它们常常依赖于基于意图分布的功能堆叠,并且伴随着 token 和时间开销的动态问题,这与静态工程不同。那么,您如何看待未来可能出现的代理累积效应?
吴恩达: 简单回应几点。你提到了 agent 和 token 成本。我给开发者最常见的建议是,在第一近似下, 先不要担心 token 的成本 。只有极少数初创公司能幸运地让用户用到让你的 token 成本成为问题的程度。它确实可能成为问题,我绝对在一些团队里看到过,用户很喜欢我们的产品,然后我们开始看 LLM 账单,发现它确实在以一种真的成为问题的速度攀升。但是,要达到让你的 token 用量成本成为问题的程度,实际上是非常困难的。对于我所在的那个幸运地遇到了这个问题的团队,我们往往有工程解决方案来扭转曲线,通过提示词优化、微调、蒸馏或其他优化方式来把成本降下来。我确实看到很多代理式工作流实际上集成了很多不同的步骤。比如,如果你构建一个客服聊天机器人,我们经常需要使用提示词,也许会用 DSPy 优化一些结果,构建评估、护栏;这个聊天机器人可能需要 RAG,作为获取信息并反馈给用户的一种方式。我确实看到这些东西在增长。另外,给你们的一个小建议:我通常会设计我的软件架构,使其在切换不同“积木块”供应商时相对容易。例如,我们有很多产品构建在 OpenAI 之上,但有时你指着某个特定产品问我:“我们用的是哪个 OpenAI 模型?” 说实话我也不知道,因为我们建立了评估体系,当有新模型发布时,我们会快速运行评估,看看新模型是否比旧模型更好。如果新模型在评估中表现得更好,我们就会直接切换。所以我们每周所用的模型可能会变化,有时我们的工程师换了模型甚至都懒得告诉我,因为评估显示新模型效果更好。事实证明,基础模型的切换成本相对较低,我们常常这样设计软件。LangChain,或者我的朋友们和我一起开发的开源工具 DSPy,就是为了让切换更容易。编排平台的切换成本则稍微高一点。但我发现,在你一层层构建越来越多的东西时,保持选择积木块的灵活性,通常能让你走得更快。希望这对你有帮助。
同学提问 : 非常感谢。在 AI 教育领域,主要有两种范式。一种是 AI 能让教师更高效,比如自动批改作业、自动布置作业。但另一个流派认为,未来每个学生都会有一个 AI 私人导师,每个学生都能获得 AI 的反馈和个性化的提问。您如何看待这两种范式的融合?以及,未来五年教育会是什么样子?
吴恩达: 我觉得每个人都感觉到教育科技即将迎来变革,但我认为颠覆还没有真正到来。我看到很多人都在试验不同的东西。Coursera 有 Coursera Coach,效果其实很好。DeepLearning更专注于教授 AI,也内置了一些聊天机器人。对了,在 DeepLearning网站上,有一个我的虚拟形象,如果你想的话可以和它聊一聊。很多团队在试验自动评分。对于像语言学习这样的领域,通过像 Duolingo 这样的应用,AI 将如何改变它,这已经变得更清晰。对于更广泛的教育领域,AI 到底会怎样改变它,我看到了大量的实验。我认为,我一直在参与一些工作的 Key Learning 所做的,对于 K-12 教育非常有前景。但我看到的基本上是大量的实验,最终的状态仍不明朗。我确实认为教育会变得 超级个性化 。但那个工作流是一个虚拟形象,一个文本聊天机器人,还是什么?我觉得几年前的那种炒作——“AGI 很快到来,一切都将轻而易举”——那只是炒作。现实是,工作是复杂的,对吧?老师、学生,人们做着真正复杂的工作流程。在未来十年里,我们将一直审视需要完成的工作,并想办法把它们映射到代理式工作流中。教育是这种映射仍在进行、但还没有成熟到最终状态清晰的领域之一。所以,我认为我们都应该继续努力。
同学提问: 我的问题是,AI 有很大潜力做好事,但也有很多产生坏结果的潜力,比如加剧经济不平等。我认为在座的很多初创公司,在创造很多伟大的事物的同时,也可能因他们的产品本身而助长某些负面后果。所以我很好奇,您怎么看我们作为 AI 开发者,应该如何平衡产品开发与某些 AI 产品潜在的社会负面影响?本质上,我们如何做到您在演讲中提到的“快速行动,但负责任”?
吴恩达: 审视你的内心。如果从根本上,你不认为你正在构建的东西能让多数人过得更好,那就不要去做。我知道这听起来很简单,但在做决定的当下,真正做到却非常难。在 AI Fund,我们已经否决了多个项目。否决它们不是出于财务原因,而是出于道德原因。有些项目我们看过,经济上的理由非常充分,但我们会说,你知道吗?我们不想让这种东西存在于这个世界上,然后我们就仅仅因此而否决了它。我希望有更多的人会这么做。我也担心是否能“带上所有人”。我看到的一件事是,各种非工程岗位的人,如果他们懂 AI,工作效率会比不懂的人高得多。比如,在我的营销团队,我的市场营销人员,他们懂得写代码。坦率地说,他们能把那些不懂代码的同行远远甩在身后。于是,所有人都去学代码了,然后他们都变得更好了。但我认为,努力带上所有人,确保每个人都被赋予用 AI 去创造的能力,这将是我们所有人工作的重要组成部分。
同学提问: 我是您的忠实粉丝之一,感谢您的在线课程,您的课程让深度学习对世界来说变得容易触及得多。我的问题也是关于教育的。随着 AI 变得越来越强大和普及,AI 真正能做的事和人们认知中它能做的事之间,似乎存在着日益扩大的鸿沟。那么,您认为对公众进行关于深度学习的科普教育,而不仅仅是教育技术人员,让人们更好地理解 AI 真正做了什么以及它是如何工作的,这重要吗?
吴恩达: 我认为知识会普及的。 DeepLearning 的使命就是赋能每个人用 AI 去构建,所以我们正在为此努力,我们很多人都在为此努力。我只想告诉你我认为的主要危险是什么。我认为可能有两个危险。第一,如果我们不能足够快地把人们一起带向前,我希望我们能解决这个问题。还有另一个危险,那就是,如果你去看移动生态系统,智能手机,其实没那么有意思。原因之一是存在两个守门人:安卓和 iOS。除非他们允许你做某些事情,否则你就不能在移动端尝试那些事。我认为这阻碍了创新。这些 AI 的危险性,已经被某些企业利用了。他们试图扼杀开源,因为很多企业乐于成为大规模基础模型的守门人。所以我认为,炒作危险性,编造 AI 所谓的虚假危险,以便让监管机构通过像加州曾经提出的 SB 1047 这样的法案——谢天谢地,我们把它挡下来了——它本会施加极其繁重的监管要求,却不能让任何人更安全,反而会真正让初创公司难以发布开源和开放权重的软件。导致不平等加剧的危险之一也是如此。如果这些糟糕的监管方式——我曾在某些场合里,亲耳听到一些商业公司对监管者说不真实的话——我认为,这些争论的危险在于,如果这些监管提议成功,最终将导致繁重的监管,只给我们留下少数几个守门人,每个人都需要得到那少数几家公司的许可,才能去微调模型、以某种方式写提示词。这才是会扼杀创新,并阻止信息传播,让无数初创公司无法负责地、带着创新的自由去构建他们想做的任何东西。所以我认为,只要我们阻止这些对开源、开放权重模型的攻击路线得逞——我们已经取得了不错的进展,但威胁仍然存在——那么最终我们会实现知识的普及,并有望将所有人带上。但是,这场保护开源的战斗,我们虽然一直在赢,但战斗仍在继续,我们仍需继续努力,来保护开源。
吴恩达: 非常感谢大家。真的很棒。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.