百度阿里CTO，同台激辩大模型|算法|人工智能|阿里cto|阿里巴巴集团

分享至

作者 | 山竹

出品 | 锌产业（公众号：xinchanye2021）

过去一年里，AI大模型如同一把利剑一样撕破长空，同时也将全球科技巨头再次聚拢到同一赛道。

这之中，自然也包括中国的科技巨头。

百度CEO李彦宏说，所有产品都值得用大模型再重做一遍。

阿里CEO张勇说，所有行业都值得用大模型再重做一遍。

2023年5月28日，在中关村论坛的人工智能大模型主题论坛上，百度CTO王海峰、阿里云智能CTO周靖人难得一见同台激辩。

在腾讯还未明确表态大模型，而百度、阿里相继于3月16日、4月11日发布文心一言、通义千问大模型的当下，在科技巨头一把手再次亲自下场部署大模型作战时，这场激辩也代表了中国两大（商业）AI大模型技术负责人的第一次公开场合交手过招。

在这样的背景下，这场公开对话，自然也就成了今年中国大模型之战的关键时刻。

这次公开对话的嘉宾，除了百度、阿里的CTO外，还有前京东技术线负责人（京东集团技术委员会主席）周伯文，此时执教于清华的周伯文还是一家AI初创公司的创始人。

对话中，他们谈到了AI 2.0与以往AI浪潮的不同、中美大模型的差距，谈到了公司内部变革和技术储备，以及人才教育、就业问题等当下热议话题。

关于这次公开对谈，锌产业做了不改变原意的整理，与大家共同一睹今年中国大模型之战的这一关键时刻：

01AGI、大模型和第四次工业革命

1、问：如何看待这波AGI浪潮，与此前的AI有何不同？

王海峰：在我看来，新一轮科技革命和产业变革正在发生。

纵观人类历史，过去200多年里已经发生过三次工业革命，第一次工业革命为人类带来了机械技术，第二次带来了电气技术，第三次带来了信息技术。

现在大家的普遍共识是，人工智能正在成为人类历史上第四次工业革命的核心科技。

历史上每一次工业革命核心技术都有一些共同特点，例如机械技术、电气技术、信息技术都有很强的通用性，它可以应用于各行各业，而人工智能技术恰恰也已经展现出了非常强的通用性，无论飞桨，还是文心，都已经应用于千行百业。

这些引发工业革命的核心科技真正对人类生产生活产生重大影响的标志性事件是什么呢？

我认为一个标志性事件是「进入工业大生产」，要高效地应用于生产，进而影响生活就需要这项技术具备高度的标准化、自动化、模块化的特征。

现在以深度学习为代表的人工智能技术已经具备了这些特征，尤其是框架层和模型层已经实现了高度的标准化、自动化和模块化。

基于此，当一个大模型产生时，它就可以非常方便、低成本地适配到各个应用场景中。

总而言之，我认为现在深度学习+大模型技术的快速发展，正在推动人工智能技术进入工业大生产阶段。

周靖人：说我们正处于一个颠覆性技术变革期，一点也不为过。

互联网时代，我们通过各种形式，例如百度通过做搜索等等，让各种信息变得触手可及。

今天出现的大模型，很大程度上是对人类知识的一个总结。有了总结之后，也就会有更多泛化能力、有更多逻辑，包括一些创新能力也会慢慢涌现出来。

因为有了这样的智能化能力后，我们各种业务应用与以往基于信息获取模式的应用有了不同，现在智能化的业务应用更可以基于行业知识的理解运行。

在大模型出现之前，大家与AI模型对话或者交互时，往往会非常小心，因为很容易触碰到AI模型的边界，这是因为今天的AI模型本身知识体系有所欠缺。

但我们和一个人交流的时候却可以很融洽，即便对方不懂你要讲的话题，他也不会完全崩溃掉。

有了AI大模型，我们真正意义上能够让AI趋近于人类这一智慧体继续演进发展。

实际上，在ChatGPT、大模型出现之前，从预训练模型开始，我们就已经形成了这样的技术思路，但这一次像ChatGPT的诞生，更多是以一个产品形式出现在大众视野，让大家知道，原来这样一个知识体的潜力是无限的。

其实今天我们也只是看到了冰山一角，到底形成这样一个类似人类智慧知识体后，能为全行业带来怎样的改变，一切才刚刚开始。

周伯文：这不是第一次出现人工智能浪潮，但这次人工智能浪潮有两个本质上的不同：

第一，AGI（通用人工智能）是通过生成式AI来突破机器理解能力的。

如果说AGI是AI的高阶形式，我的判断是，生成式AI就是AGI的必经之路。这可以回溯到诺贝尔物理学奖得主费曼的一句名言，“凡是我不能创造的，我都没有真正理解”。

如果说人的智能没有生成、没有创造，就没有真正理解的话，那此前我们围绕「理解」做人工智能研究并没能真正把AGI道路打通。因为「理解的判断」是模糊的、是黑盒子，「生成的判断」是通过“生成”来倒逼形成“理解”，OpenAI正是基于此将大模型变成了整个世界知识最好的压缩器。

第二，这一次人工智能的成功是基于人与AI的协同交互得到广泛关注的。

此前人工智能引发热潮，都是通过击败地表最强人类获得的广泛关注，我们看到，这一次人工智能的成功是基于人与AI的协同交互。

过去一段时间里，ChatGPT的每一次成功，你惊讶的不仅仅是这个大模型的能力如何，还有背后人与AI协同prompt，以及人工智能犯错之后的纠错能力。

这是人类历史上第一次通过人与AI的协同交互带来全新的AI能力的突破。

我们人类是需要一个和我们对立对抗的AI，还是与我们协同交互的AI？

显然我们更需要的是后者，更何况这种协同交互的AI让应用的边界、场景、价值都提高了一个数量级。

因而这种突破毫无疑问价值更大。

Daniel Kahneman在其畅销书《思考，快与慢》中认为，人的思考有两种模式——系统1和系统2，系统1是快思考，迅速做决策；系统2是慢思考，要做大量的推理和计算。

我认为，未来AI会逐渐进化为系统2模式的AI。

5年前人工智能落地，例如人脸识别，都是基于卷积神经网络在做系统1模式的AI，系统2模式的AI在2017年被大家还认为是无法实现的。

但是到ChatGPT出现之后，特别是进化到GPT 4之后，AI具备系统2能力的趋势已经越来越明显了。

未来当AI越来越强大，能做系统2的工作时，人如何与AI进一步进行协同交互就成了一个关键问题，这也是为什么我在清华成立的实验室叫协同交互智能研究中心的原因。

02中外模型有差距，通用数据能互通

2、问：影响AI大模型效果的因素有哪些？大模型的核心竞争壁垒是什么？

王海峰：算法、算力、数据都会起很大作用，这个是肯定的。

简单来说，算法有更好的算法，数据有更多的数据，或者有更多算力还不够，更重要的是，三者要联合优化。

在我们前面提到的四层架构中：

算力是基础，算力很大程度上是在和框架平台这一层打交道，例如飞桨这样一个深度学习框架平台，它与几乎所有主流芯片都做了适配，不管是国际的还是国内的，到算法要用时，就可以不用太多关心芯片本身。

算法是很核心的因素，很多进步最终还是（依赖）算法，而且算法进步可能效率更高。一个算法的改进，很可能会带来数倍甚至成数量级的提升。

数据很大程度上意味着应用场景，我们建构一个基础预训练大模型时会用到很多数据，这就意味着它已经有一个基本的通识知识。但应用于各种场景时，每一个场景都会带来自己的数据。

当一个场景要用这种大模型的时候，往往针对这个场景的需求，标注很好的数据，就会得到事半功倍的这种效果。

我们日常工作中，其实算力、算法、数据这几方面都是在优化，而且是在联合优化，不断相互影响，互相迭代，反复优化。

3、问：中外数据集有多大差距？中国大模型能否实现赶超？

周靖人：中文和英文的数据质量存在差异是一个不争的事实，互联网发展至今，如今海外在通用知识，包括整个公开数据集的完整性、系统性确实是有优势的。

大模型在很大程度上是在学习人类的知识，就通用知识而言，无论是何种语言并不会对大模型训练产生影响，原则上在高阶潜在空间（letent space）中，各种语言相互之间是完全匹配的。

这也是为什么今天像ChatGPT原本没有用中文训练，但一下子就有了泛化中文的能力，就是因为语言在通用知识上是完全匹配的。

当然，不可否认的是，各个国家有各自的文化历史，我们有古文，也有自己的文化传统，这些都是不一样的，大模型最终也一定与文化和历史密切相关。

当你在做医疗领域业务系统应用时，可能数据会比较少，今天正是因为大模型的通用知识已经到达了一定的程度，有了这样的通用AI大模型，往往只需要少量样本数据，就已经能够应用到实际场景中。

至于中外AI大模型的差距，我们要承认今天像OpenAI已经有了很大的领先优势，包括它有前期一系列投入，但我们今天并不是简单地说要和OpenAI哪一个模型进行比较，因为我们不认为当前OpenAI的大模型是终极形态。

今天我们都会朝着一个更加智能的大模型发展，例如具备更多多模态理解能力，具备更强大的复杂逻辑思考能力，包括如何将人类的个性思考加入到模型中，甚至更长远来看，如何将我们的文化底蕴融入进去，这些都是今天尚且存在有待解决的问题。

今天在科技创新的道路上，我们在非常兴奋地与包括OpenAI在内的团队进行互相交流，甚至和国内同行一起在这方面不断创新，不断突破。

03AGI带来的企业内部变革

4、问：从你们企业内部来看，AGI对你们的团队带来了怎样的影响？

周靖人：今天我们处在这样一个时代，应该说对各行各业都会产生极大的触动。

对于我们这样的技术公司内部而言：

首先大模型会帮助我们提升工作效率。其实这可以延伸到个人助手的概念，它会像是我们的一个个人助手，也许是工作助手，也许是生活助手，也许是会议助手。海外其实已经在提Copilot这样一个概念。

在这方面，AI今天会极大地提升人类各类工作的工作效率，无论是今天的代码编写，甚至一些需要创造性思维的工作，工作效率都会得到大幅提升。

其次大模型会提升我们技术开发效率。包括系统开发、系统设计在内的整个技术体系，也会因为通用AI大模型的变化带来效率的提升，这些都是我们能够看得到的。

实际上，如今技术领域我们所谓的优化问题，甚至技术底层的优化问题，都会因为今天AI大模型的发展得到全面升级。

总结来讲呢，我觉得今天我们各行各业，不管是技术人员还是非技术人员，我们的生活、工作都会迎来一个质的改变。

王海峰：百度已经从早期的互联网公司转变成为一家我们现在叫有强大互联网基础的领先的人工智能公司，那么，作为一家人工智能公司，我认为我们日常就AI会有两方面的工作：

一方面，我们要研发这个最先进的人工智能技术。

前面提到的四层架构我们都有，比如说做芯片，做深度学习框架飞桨，做文心一言这类大模型，我们要研发这些技术。

另一方面，在百度内部做业务的同事，更多是要去使用人工智能技术。

关于人工智能技术的使用，我认为又要包括两方面：

一方面，要对技术本身的能力、边界，以及如何使用，要有理解。

当然，现在平台越来越成熟，很多技术在平台上可以很方便地使用，但你也要理解这样一个技术，它到底能做什么、不能做什么。

另一方面，对自己所从事的所负责的业务，其中的应用场景、用户需求，以及相应的产品要有深刻的理解。

做工作的时候，一个员工很重要的工作是将真正的应用需求和技术连接起来，而现在技术平台本身越来越强大，很多技术在平台上可以有更好的支撑，更高的标准化、自动化、模块化，要能用好这些技术去解决这些场景问题。

有这两方面呢，我认为就既能把技术做好，也能让它在实际应用中带来真正的价值。

04就业问题，如何抉择？

5、问：AGI时代下，如何择业？

周伯文：现在大家在训练通用AI大模型时用了大量的数据，所以训练完后，它就具备了一些通用的推理、上下文学习能力，但是如果仔细看今天的GPT的话，我的一个总结是：外行人看起来像内行，内行看起来算是外行。

我曾经问过我的学生这样一个问题：你们认为ChatGPT生成的答案是创造还是剽窃？

结果是，在场的一半学生认为是剽窃，一半认为是创造。

为什么会这样？

拉姆·诺姆·乔姆斯基（Avram Noam Chomsky）是麻省理工学院的语言学家，他的著作数量号称是现在西方世界在世的人中仅次于圣经的人，他曾在纽约时报发文称，ChatGPT就是赤裸裸的剽窃。

出现这一现象的核心原因在于：你如果是一个有原创思维的人，你会发现ChatGPT就是在剽窃，它在剽窃乔姆斯基著作中的论述；但是如果说你是一个任务驱动的人，是一个为了完成目标的人，它确实可以帮你完成工作。

这意味着什么？

我的第一观点是，真正要让AGI发挥价值，目前的通用AI大模型是不够的，它只能完成一些长尾的、低价值任务。

如果你需要完成高价值任务，是需要很多专业知识的，目前的AGI系统是不完备的，这也是谷歌task force小组最近一篇研究论文中的一个结论。

那我们应该怎么办呢？

这就意味着，你把一个AI训练到大学毕业了，你还要尽可能地再就相应的专业知识对它进行训练。例如在金融行业，就需要在泰康这样的公司中继续做各种训练。

这和我们的教育、择业有什么关系？

经过前面这样一个分析，我们就可以得出一个结论：

如果你是一个只做重复的、简单的摘要转述、综述工作的人，未来一定会被AI取代。

但如果你的工作是专业性很强，特别是需要批判性思维、反思性思维的工作，这还是人最擅长的。

有了这个原则后，关于择业问题，我会给出两个建议：

一个是从大脑出发，一个是从心出发，选择未来的职业。

从脑出发是指，你要选择那些需要你具备批判性思维、深入思考能力，去找具备更高知识密度和智慧密度的工作；

从心出发是指，我觉得还要去考虑人与人的连接，人与人的关系，以及人文社会的这种守护者，这个是AI取代不了的。

所以，选择从脑出发或从心出发的行业，会更好地让一个人与AI共存。

6、问：AI能力越来越强，人才培养需要有怎样的调整？

王海峰：作为第四次工业革命的核心技术，在人工智能技术进入工业大生产阶段后，意味着将对我们的生产生活的方方面面产生影响。

我们会说AI原生，我们的产品、应用要做AI原生，人才其实也是一样，不管学生学习，还是工作以后继续学习，要学习的是和AI一起来去工作，一起来去搞科研。

由于AI的快速发展，科学研究的方式实际上也在快速发生着变化。

这个月我百度研究院刚刚在这个nature上发表了一篇生物计算方面的论文，生物计算本来不是像百度这样的公司的主攻方向，但是我们把一些AI技术和生物计算结合研究也得到了很好的效果。

再比如说飞桨平台，平台上AI for Science系列能力现在被应用得非常广。

周伯文：人工智能的变化也在倒逼我们重新思考什么是教育的本质。

这里我们不讲教育的本质，我们讲一讲科研的本质。我觉得是从提出一个好问题开始，到解决这个问题结束。

在ChatGPT出来之前，大家可能也是这么认为的，但ChatGPT出来之后，我觉得这个观点被大家接受得更快了，这是我自己的观察。

这对我们的教育和科研意味着什么？

我自己有几点思考：

第一，现在科研的门槛在变低；

第二，二流工作价值在变小，一流工作价值更稀缺；

第三，交叉变得尤为重要。

刚才海峰也讲到新的科研范式，我刚才提到系统1和系统2，其实也是我认为科研范式一定会改变。

nature今年1月一篇封面文章指出，我们过去50多年来突破性创新的速度在变慢，论文在变多，专利在变多，但是突破性成果在变少。

一个很大的原因是科学的学科越来越完善，每个学科之间存在信息茧房，茧房内部信息过载，茧房之间的门槛过高，但是ChatGPT的出现后，如果你能用好大模型，其实你可以更好地让AI帮你理解其它学科，能够更好地形成互动，和交叉，这种交叉会促进新的创新的产生。

新的科研范式一定会是AI会和人去协同共创，去提出新的理论。

我们目前在做的一个研究是让一个大模型去阅读完2000年以前所有蛋白质组学的文章，然后让它独立提出一些新的蛋白质的科研假设，如果这些科研假设能够被2000年以后人类科学家研究论文所证实，那就说明它提出的是一个非常好的问题。

我觉得这个是AI for Science的下一步。

AI for Science意味着AI不能仅仅用来做计算，还要帮助我们去提出更好的问题。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

百度阿里CTO，同台激辩大模型

01AGI、大模型和第四次工业革命

02中外模型有差距，通用数据能互通

03AGI带来的企业内部变革

04就业问题，如何抉择？

人类首次！去月背取样，中国人再进一步

"胖猫"遭女友索要51万后跳江 女方疑回应：不存在PUA

"胖猫"遭女友索要51万后跳江 女方疑回应：不存在PUA

湖人官宣解雇哈姆 新帅多人候选名单曝光

黄子韬被曝求婚徐艺洋 大量亲密照曝光

远超想象?"股神"巴菲特的AI投资布局

北京车展上的概念车,AI如何点评?小米SUV发布?

态度原创

TTS新传名词解释：社交机器人｜新传考研前沿概念

心之所栖 黑白灰色系打造设计专属感

景区“顶流”生意，为何越骂越火？

食味印象 | 潍坊：碳水脑袋的人间乐园

俄"硬核军事展览"开幕 现场"人山人海"

"胖猫"遭女友索要51万后跳江女方疑回应：不存在PUA

"胖猫"遭女友索要51万后跳江女方疑回应：不存在PUA

湖人官宣解雇哈姆新帅多人候选名单曝光

黄子韬被曝求婚徐艺洋大量亲密照曝光

心之所栖黑白灰色系打造设计专属感

俄"硬核军事展览"开幕现场"人山人海"