独家对话智源学者刘知远：中国AI要向外卷，而不只是做第二个OpenAI|openai|人工智能|杨霞清

分享至

出品 | 网易科技《态度AGI》

作者 | 袁宁

对话 | 杨霞清

编辑 | 丁广胜

大模型行业仍在高速奔跑，也正在进入它真正的分化时刻。

最早，“有卡就能追”；后来变成“有数据就能追”；再后来，大家发现，即使有钱、有卡、有团队，也未必能做出真正领先的模型。行业开始收敛，玩家开始减少，路线也逐渐分化。

有人继续卷规模，有人转向Agent，有人下注世界模型。但刘知远和他的团队思考的是另一个问题：AI为什么一定只能发生在云端？

过去几年，云端模型代表规模、资本和速度，也代表一种已经被证明过的路径。但刘知远想做的，是：端侧智能，高密度，小模型。

刘知远是清华大学计算机系教授，也是北京智源人工智能研究院智源学者，曾参与我国首个超大规模智能模型“悟道”大模型的研发，是国内最早进入预训练模型研究的一批人。

2022年，刘知远创立面壁智能，并出任首席科学家。2025年11月，他和团队关于“大模型密度定律（Densing Law）”的研究登上《自然·机器智能》（Nature Machine Intelligence）封面。论文回测了51个主流模型后发现：过去两年，大模型的“智能密度”正以每3.5个月翻倍的速度提升。

换句话说，大概每100天，我们就可以用一半参数，实现相同水平的智能。今天只能运行在云端的能力，未来或许会被压缩进手机、汽车、PC、手表、汽车、冰箱……甚至任何一个普通终端。

在和刘知远的对话中，他多次提到“向外卷”。他始终警惕着另一种更隐蔽的风险：所有人都在用同样的方法、同样的叙事、同样的终点定义自己。

所谓“外卷”，某种程度上也像面壁智能自己的路线选择：不是在同一条赛道里，把别人已经证明过的事情再重复一遍，而是走进真实产业、真实场景和真实生活，去寻找那些尚未被充分定义的问题。

他提到：

“模型已经不再只是一个纯科研问题，而是一个典型的‘产研结合’问题。你既要有一线科研能力，能够持续创新；同时还要有非常强的工程能力、系统能力，以及完整的产业化能力。”

“行业内有一种观点，中国模型研发速度和美国有6到12个月差距，并不意味着原始创新能力只差6到12个月。因为原始创新本身是最难的事情。”

也正因如此，在他的视角里，像北京智源人工智能研究院这样的机构会变得越来越重要。

它既不同于传统高校，也不同于国家实验室，更不像一家纯商业公司，而是处在产业、学术与研究之间的一层“中间地带”。因为很多原始创新，本身并不天然适合KPI，也未必能快速对应商业回报。它需要允许长期探索，允许失败，也允许一段时间内“不知道答案”。

而这场对话讨论的，也早已不只是一家公司如何押注一条更少人走的技术路线，而是中国大模型产业的分化与选择；不只是中美模型能力的差距，更是原始创新体系之间的差距，以及一个社会需要怎样的创新支持系统；也不只是关于未来人才的培养，而是，未来人如何和AI共处。

我们真正好奇的是：在一个被技术迅速改写的时代，一个人、一家公司，甚至一个行业，究竟该如何找到自己的位置。

以下是网易科技《态度AGI》栏目独家对话智源学者、面壁智能联合创始人兼首席科学家刘知远的内容：

中美大模型差距，不只是落后几个月，而是原始创新还太少

网易科技：4月下旬，DeepSeek-V4发布后，相对于V3，行业的反应相对平淡。你怎么看待V4这个模型？

刘知远：我觉得这是正常的。V3出现的时候，其实所有人都没有那么高的预期，它是真正意义上的“横空出世”。但 V4不一样。大家半年前就已经开始等它了，行业的期待值已经被拉满了。

在这种情况下，它很难再带来第一次看到 GPT-4或 DeepSeek-V3时那种震撼感。

但这并不意味着它不重要。它仍然代表中国模型能力的一次关键推进。

网易科技：我们看到有国外科技博主给4月集中发布的大模型打分，GPT-5.5是60分，Claude Opus是57分，V4只有52分。这是否也反映了中国模型跟世界头部模型还是存在一定的差距？

刘知远：从 ChatGPT出现开始，我们一直认为，中国和美国之间的差距是在缩小，但差距依然存在。

2023年的时候，我们跟 GPT-4的差距，大概是一年。到 DeepSeek-R1，我们可能用半年就能复现 OpenAI o1的能力。

今天我会认为，中国模型仍与世界顶尖模型有一定差距。

所以我觉得，一方面要保持清醒，承认差距；但另一方面，也没有必要因此过度恐慌。

网易科技：当下世界头部大模型的几家轮流坐庄。在2026年这个时间节点，大模型真正比拼的东西是什么？影响大模型竞争格局的变量会是什么？

刘知远：这个行业正在快速收敛。它其实很像当年的集成电路产业。想要真正具备国际一线水平，需要满足的条件会越来越多。

在2022、2023年的时候，可能只要在某几个方面具备优势，就有机会迅速做出一个世界领先模型。因为那个阶段，整个行业还相对粗放。包括 OpenAI当年的 GPT-3，其实很多地方今天回头看，也还是比较粗糙的。

但科技发展的规律就是这样：随着技术不断成熟，各个要素都会迅速迭代、迅速补齐。

发展到今天，一个模型训得好不好，已经和很多因素有关：模型架构、数据治理水平、模型风洞完整程度，以及软硬协同能力等。

所以你会发现，到了今天，能够持续在国际一线发布模型的团队，其实已经逐渐收敛到少数几家了。

网易科技：那最后还能留在牌桌上的玩家，需要具备哪些能力？

刘知远：我觉得可以分两个层面来看。

第一个层面，是 AI这几年正在快速从“象牙塔”走向产业。

大模型已经不再只是一个纯科研问题，而是一个典型的“产研结合”问题。既要有一线科研能力，能够持续创新；同时还要有非常强的工程能力、系统能力，以及完整的产业化能力。任何一个环节出现短板，都会影响模型在全球范围内的竞争力。所以未来一个非常重要的趋势，就是“产”和“研”的进一步融合。

第二个层面，是我们虽然已经找到了推动 AGI 持续发展的基本规律，也就是所谓的 Scaling Laws（规模法则），但每一个阶段，仍然需要新的技术突破。

过去大家认为：只要有更多数据、更多算力，模型能力就会持续提升。但发展到今天，你会发现新的问题开始出现。

比如到了2024年，全球公开可获取的数据其实已经接近耗尽了。这就需要新的技术路线，让模型能够自己探索、自己合成数据，持续提升能力。

换句话说，如果继续沿着传统规模法则往前推进，算力成本也会越来越不可持续。未来不可能真的去用几百万张卡训练一个模型，这个成本没有任何机构能够长期承担。

所以我们团队提出“密度定律”，希望在规模法则之外，找到新的效率提升路径。既提升模型能力，又降低训练成本，让 AGI 的发展变得可持续。未来真正重要的，仍然是那些既有创新能力、又有工程能力的团队。它们既是互补关系，也是协同关系。

过去大家理解的 Scaling Law，就是模型越大，能力越强，它对应的是一条持续向上的增长曲线。而 Densing Law 是一条“更陡峭”的增长曲线：在相同模型尺寸下，实现更高智能；本质上，它是在提升模型的“智能密度”。

网易科技：国内模型最大的瓶颈之一，还是“缺卡”吗？

刘知远：如果是在2023年，很多机构认为限制模型发展的核心问题是算力，我认为是成立的。

但到了今天，我们应该意识到：真正决定模型能力的因素，已经越来越多了。

算力当然非常重要，但如果你没有架构创新、没有数据治理创新、没有软硬件协同能力，那么即使你有很多卡，最终训出来的模型也很难真正具备竞争力。

为什么 DeepSeek-V3在2024年底会引起全球关注？因为它告诉大家：我们可以用更低的参数激活量、更低的训练成本，达到此前国际顶级模型的效果。

这背后真正重要的，其实是架构创新、细粒度设计，以及软硬协同上的突破。让大家意识到：原来训练世界级模型，并不一定只能靠“无限堆算力”。

所以未来真正重要的，还是持续创新。

网易科技：刚才提到中美大模型仍然存在一定差距。但有些人会认为，中国已经能用更低成本实现更大的价值。你怎么看中美模型各自的长板和短板？

刘知远：今年，Anthropic Claude 在全球范围内的表现，其实是非常强势的。它去年底到今年初发布的一系列模型，在代码能力等方向上都非常领先。

到目前为止，我认为中国还没有任何一个模型真正超越 Claude。包括 DeepSeek-V4在内，中国模型与国际最先进模型相比，在一些能力上仍然存在差距。我们还是需要非常客观地分析自己当前所处的位置。

我们说中国模型研发速度和美国有一定差距，其中最重要的还是原始创新能力。

因为原始创新本身是最难的事情。真正的开创者，需要在完全未知的方向上做大量开放性探索。很多时候要兵分多路、不断试错，最后才能找到真正有效的路径。

但跟随者不一样。跟随者只需要看到开创者已经验证成功的路线，然后沿着这条路继续推进。

这两者在成本、难度，以及对原始创新能力的要求上，其实完全不是一个量级。

所以我认为，美国目前最大的优势，其实是在大模型和 AGI 最前沿方向上的原始创新能力。而这恰恰是中国目前最欠缺的部分。

网易科技：那 DeepSeek-R1算是一次原始创新吗？

刘知远：DeepSeek-R1为什么能够登上《Nature》封面、获得全球认可？很重要的原因在于，它是在 OpenAI 没有公开完整技术路线的情况下，做出了真正有价值的创新。

这件事本身非常不容易。但即使如此，我依然会认为，它还不是最原始层面的创新。

因为 OpenAI 的 o1已经向全世界证明了一件事：原来模型可以通过这种方式实现深度推理能力。一旦这个方向被验证成立，后面的人就拥有了一个明确目标。后续的创新，更多是在这个方向上的技术推进与工程突破。

因为它意味着：这个问题是存在标准答案的。对于后来者来说，这会极大降低探索的不确定性。

所以我觉得，中国需要非常清晰地认识到：我们今天已经具备了非常强的跟进能力，但在最顶层的原始创新上，仍然需要继续追赶。

网易科技：那中国的优势是什么？

刘知远：最大的优势，首先是“势能”。

过去20年，中国经历了从互联网、信息化，到今天智能化的快速发展过程。

我从2006年开始读博，到现在整整20年。我能非常明显地感受到，中国已经从当年几乎无人关注AI 领域的状态，发展成今天全世界唯一能够在人工智能最前沿与美国持续竞争的国家。这种进步速度，本身就是非常巨大的优势。

我们拥有庞大的人才基础，也形成了非常强的社会共识。整个国家、整个产业、包括普通人，都非常认可：这场科技革命必须抓住。

我觉得这种全国性的共识，其实是非常难得的。放眼全球，很少有国家能够像中国一样，对一场科技革命形成如此强烈、持续的投入意愿。

其次，我觉得是中国巨大的应用市场。中国 AI 的技术突破和产业应用是高度协同的。从政府到各个行业，对 AI 的接受度都非常高，也愿意开放大量真实场景。所以中国的应用落地速度会非常快。

而 AGI 最终带来的，是一场类似工业革命级别的智能革命。本质上是在用 AI 去替代人的机械脑力劳动和部分体力劳动。所有依赖知识和经验的行业，未来都需要被 AI 重构。我们在技术应用和结合，在全世界范围，在应用创新上的能力和愿景其实是非常广阔的。

智源、悟道与中国AI的“仙童时刻”

网易科技：您最早做通用模型研究。回头看，智源研究院和“悟道”项目，对您后来判断大模型与产业方向产生了怎样的影响？

刘知远：这个其实和智源研究院有关系。

2020年，OpenAI 发布 GPT-3，是一个非常重要的历史节点。是全球第一个真正意义上的千亿参数模型，1750亿参数，而且第一次展现出了非常流畅的自然语言生成能力。那个震撼，对当时整个行业来说都非常大。

在 GPT-3出现之前，我们作为国内最早一批做预训练模型的团队，已经觉得自己站在了全球前沿。那时候我们训练的还是单机八卡、上亿参数级别的模型，在国内已经算非常先进了。

但 GPT-3一出来，我们突然发现，人家已经在用2000张卡训练千亿模型了。瞬间意识到，双方已经不在同一个数量级。

当时我正好是智源学者。智源本身又是一个非常年轻、非常有活力的科研机构。我们当时专门向智源决策层汇报了 GPT-3的情况。我们认为，这不仅仅是一次模型升级，而是通用人工智能方向上的重大突破。但它又极度依赖基础资源，因为你想训练更大的模型，就需要更多 GPU。

可那时候国内大部分团队，可能连几台机器都没有。

后来智源很快做了决定，批了几百万，采购了10台 V100。今天看可能不算什么，但在当时已经是非常大的投入。我们也正是基于这批算力，训练出了26亿参数模型。它生成文本的流畅程度，相比我们之前的模型有了非常明显的跃迁。

我觉得，那其实是中国大模型真正开始起步的一个重要节点。

到了2021年，智源内部已经基本形成了“大模型会成为未来核心方向”的共识。后来有了唐杰老师牵头的“悟道”项目，我们团队也是参与者之一。

网易科技：智源学者群体对中国大模型行业做出了重要的贡献，您怎么看智源学者这套机制，它的独特之处是什么？

刘知远：作为这个智源学者中的一员，智源最特别的一点，是和国内很多传统人才计划都不一样。

并不会要求你每年交多少论文、多少专利、多少 KPI，也不会天天检查你是不是在“认真干活”。背后其实是一种非常先进的理念：一种基于信任建立起来的学术共同体。

首先智源会找到这个领域最有公信力的专家，再由这些专家去选择他们真正认可的人。整个过程相对非常公平。而且选出来之后，也不是靠各种行政化管理去驱动创新，而是给予充分信任。

我觉得“信任”是这里面最核心的关键词。因为真正顶尖的研究者，本来就不需要靠外部监督来驱动。恰恰是在这种信任之下，很多学者才会真正愿意围绕智源这个平台，去做一些“不一样”的探索。

包括“悟道”项目的推进，也体现了这一点。智源的决策链条非常短、非常快。很多大型科研项目，可能光论证就要一年，等真正立项的时候，国外已经做完了。但智源当时能够在非常短时间内完成决策，并快速投入资源。

我觉得这背后，本质上还是一种对人的信任，对方向的信任。

更重要的是，它把很多真正优秀的人聚在了一起。很多时候，一群高水平的人长期交流、碰撞，本身就会催生新的思想。所以你会发现，智源在全国范围内押注大模型，其实比很多机构至少早了一年。

具体形式不重要，真正重要的是它背后的内核。这需要一代一代传承下去。

网易科技：当时的“悟道”项目，本质上就是一场“非共识下注”？

刘知远：对，我觉得它本质上是一场非常重要的“风险投资”。

2021年是什么时间点？那时候 OpenAI 都还不是今天的 OpenAI。GPT-2发布的时候，很多人甚至还在嘲讽“大模型路线”。整个行业对大模型是存在巨大争议的。

但就在那个时候，智源愿意投入几千万甚至上亿资源，组织大量算力去支持模型研发。这个事情，本身就非常有前瞻性。

某种程度上，很像硅谷早期的“仙童时刻”。硅谷最早并不存在，后来有了仙童半导体，再后来“八叛逆”离开仙童，成立 Intel、AMD 等一系列公司，最终形成整个硅谷生态。

今天再回头看，中国很多大模型公司，其实都和智源有很深关系。

所以我觉得，智源在中国 AI 发展史里，很可能会成为一个非常关键的起点。

网易科技：智源研究院和传统的高校、科研院所、企业研究院有什么不一样？在中国 AI 研究体系里，它扮演的是什么角色？

刘知远：我觉得智源的位置其实非常特殊。

高校最核心的使命，首先还是培养人，同时做原始创新。尤其是那种最前沿、最原始、甚至很多人一开始觉得“不靠谱”的方向，这些更适合发生在高校。因为高校相对能够给老师更大的自由度，去做长期探索。

另外一端，是中科院、国家实验室这样的机构。它们更偏向国家战略科研力量，要完成一些非常明确的大型任务。像“两弹一星”、曼哈顿计划、登月工程，本质上都属于有组织科研，需要几千个科学家协同完成。

我觉得智源更像是在这两者之间。

智源做的事情，不像高校那么“从零开始”，但又没有进入国家实验室那种高度确定的大型工程阶段。它更像是在一个方向已经出现明显苗头之后，快速组织资源，做前瞻性的孵化和探索。“悟道”项目就是一个典型案例。

当时整个方向已经初步显现，但行业里真正做的人还不多。智源能够敏锐地感知到这个趋势，然后快速聚集上百号人、组织大规模算力，推动它形成规模化发展。

所以我会更倾向于把智源理解成一种“大型原始创新的孵化器”：处在高校之后、产业之前，负责把一些前沿方向真正推向社会。

当然，这样的机构其实对管理者要求非常高。

因为它必须具备非常强的前瞻性和实事求是的精神。你可以想象，我们在2021年发布悟道1.0的时候，其实争议非常大。很多人会觉得：为什么要花这么多钱去训练一个万亿参数模型？到底有什么用？在那个阶段，非议是非常大的。

大模型应该“向外卷”，关注原始创新！

网易科技：现在国内大模型公司路线开始分化。字节阿里等大厂，智谱、Minimax、月之暗面、阶跃、面壁智能、百川、零一等，都在走向不同的发展方向。你怎么看中国大模型发展路线的分化？

刘知远：进入 AGI 时代之后，所有东西都是新的。在这种情况下，中国一定会形成由科技创新驱动的新商业模式。

回看美国科技史的发展过程，始终有大量原始创新。从仙童半导体，到后来的英特尔、苹果、微软、谷歌，这些公司都曾经做出过真正意义上的重大突破。

而中国的企业过去更擅长的，其实是“Copy to China”。2000年左右，美国有什么模式，我们就把它复制到中国，再进行本地化。

到了2010年之后，我们开始出现模式创新，比如支付宝、微信、抖音。但那个阶段，本质上还是商业模式创新，而不是底层技术突破带来的创新。

我认为，未来十年的 AGI 时代不一样。这是一个真正全新的时代。所有行业都还是蓝海，存在各种各样的可能性。在这种情况下，我们当然要去追求通过技术创新来驱动我们在商业上的成功。

而且你会发现中国和美国的竞争也特别有意思。比如说，都是做大模型，OpenAI 出现之后，Anthropic 就不会说“我要做第二个 OpenAI”。它选择了另一条路，比如大幅强化代码能力，走出了一条全新的发展模式。

这是非常健康的。因为 AGI 是一个极其广阔的领域。既然还有大量未知空间，为什么一定要在同一条路上卷？

面向未来，中国一定要形成类似美国历史上那种通过原始技术创新取得商业成功的模式，而且一定会有，因为这是一个非常广阔的领域。

网易科技：这也是面壁选择端侧模型路线的原因？

刘知远：是的。我们一直认为，未来的智能不可能只存在于云端。

首先，历史上，计算本身就一直同时存在：超级计算、云计算、端侧计算，人工智能也一定会是这样。

未来一定会出现一种“距离用户最近”的智能。它能够真正理解用户的长期历史、个性习惯，成为用户专属、最懂用户的大模型。这件事是非常自然会发生的。

既然已经有人在做云模型，我们为什么还要重复做同样的事情？我觉得做这种重复工作是很没意思的。这是内卷式思路，已经是上一个时代的竞争模式了。

其次，选择端侧，既有非常清晰的技术支撑，也有非常清晰的历史类比。这也是为什么我们坚定选择端侧方向。

很多真正大的创新，是“反共识”的。如果所有人都认可一件事，它往往不会是最大的创新。就像 Anthropic 当初重点做代码能力的时候，很多人其实也未必看得懂。

网易科技：阶跃、阿里千问、字节豆包，也在讲“端侧智能”，面壁智能和他们的路线有什么不同吗？

刘知远：差别还是很大的。面壁智能从2024年初就开始持续投入端侧大模型，是国内最早系统布局这一方向的团队之一。

到底什么叫“端侧智能”？如果说「在手机上调用云端模型」就叫端侧智能的话，那么所有大模型公司都在做端侧。但是，单纯在终端上调用云的 API 无法实现端侧智能的核心价值，包括：断网也能跑，执行任务不消耗云端 token，数据存储在本地保护隐私安全。

端侧智能最本质的价值，是：即使断网、没有云端 API，模型也能真正运行在端上——模型在本地、数据也在本地，同时满足终端散热、网络、内存、功耗、算力等等多因素的约束。这是面壁智能从2024年就开始真正持续投入的事情。

我们希望把智能放在距离用户最近的地方，而不是只是在用户附近去调用一个云端服务。这是我们认为的不同之处。

端、云模型的使命各不相同

网易科技：云端模型和端侧模型，本质上会是不同的应用场景？

刘知远：对，而且我觉得要用动态的眼光来看这个问题。因为端和云之间的边界，其实一直在变化。Densing Law 告诉我们一件事情：大概每100天，我们就可以用一半参数，实现相同水平的智能。继续沿着这一趋势看，更多今天只能运行在云端的模型能力，未来都有可能逐步下沉到手机、PC、汽车等终端设备上。

这件事情，我认为一定会发生。

可以设想：两年之后，也许我们能在终端设备上运行一个接近今天 GPT-5.5水平的模型。到那时，一个很重要的问题就会出现：我们真的需要一个“爱因斯坦级”的模型，来处理每个人的日常需求吗？

其实未必。我们每个人的管家，只需要理解我们个人需求就可以。

我们会认为，面向未来，端上模型的使命和云上模型的使命会不同。

端侧模型最重要的使命有两个：第一，理解用户。第二，理解外部世界有哪些能力可以服务用户。

比如用户需要数学能力，它不一定自己最擅长数学，但它知道应该调用哪个最强数学模型；用户需要医疗能力，它知道该连接哪个专业系统。所以未来端侧 AI，更像是用户真正的个人智能代理。

它最核心的价值，不是“无所不能”，而是：它足够理解你，并且知道如何替你调度整个互联网世界里的智能资源。

而云端模型则会越来越专业化。比如：滴滴会有自己的出行模型；美团会有自己的外卖模型；抖音会有自己的娱乐推荐模型；这些模型会深度结合各自行业的数据和场景，形成专业化智能服务。

而端侧模型，则会成为用户统一的入口，再由它去连接背后的各种云端能力。这是我们对未来智能体系的一种判断。

另外，端和云代表未来业界发展的模式。过去80年的信息革命，形成了三种计算形态：超级计算负责高精尖科学计算；云计算负责大众化服务；端侧计算负责用户最实时、最隐私、最贴身的需求。

而未来智能的发展，我认为也一定会对应形成：超级智能、云服务智能、端侧个人智能，因为智能最终还是依托算力存在。算力在哪里，智能就会在哪里。

网易科技：面壁智能如何在汽车、手机、PC 等行业落地端侧智能？

刘知远： AGI 时代一定会出现新的智能终端。但不同终端的产业结构其实不太一样。

比如手机行业，是高度寡头化的市场。看起来竞争激烈，但真正的大厂就那么几家；海外更集中，基本就是 iPhone 和三星。

面壁不需要亲自进入“造手机”这个市场。因为这一定会是传统手机厂商全力投入的方向。

我们的策略是：要进入手机生态，但不是自己做手机，而是和产业伙伴深度合作。比如和股东、合作伙伴，包括像华为这样的企业，一起去推动智能时代手机能力的升级。

汽车行业本身既有新势力，也有传统车企，整个产业更倾向于通过产业链协同完成升级。所以我们会和车企、Tier 1、Tier 2等合作伙伴一起，尽快以标准化的解决方案来推进模型放到车上，支持智能座舱相关的迭代，并且在这个方面形成产品化。

但我们也不可能造车。我们认为，通用人工智能时代一定会出现新的智能终端形态，并由此承载端侧智能的相关服务。

网易科技：在具身智能方向，端侧模型如何落地？

刘知远：对于具身智能来说，最核心的变化，其实就发生在输入端和输出端。

输入端的核心是“全模态”。模型需要真正建立起对物理世界的感知能力。今天的大模型，已经有：文本、图像、语音。但未来还远远不够。

机器人还应该有：触觉、嗅觉、空间感知、红外感知、雷达感知、电磁感知。这些东西，其实都属于未来可能出现的新模态。甚至很多感知能力，是人类本身不具备的，但机器天然可以拥有。所以未来 AI 对世界的感知，很可能会比人类更加全面。

输出端的核心是 Action。模型如何驱动机器人在现实世界中完成行动。这件事非常关键。也是今天多模态模型、VLA、世界模型等方向，正在努力迈出的下一步。因为“理解世界”和“改变世界”，中间还存在很大距离。

现在很多人都在谈“具身智能的 ChatGPT 时刻”，我觉得还没有到。很多时候，一个领域是不是迎来了“ChatGPT 时刻”，不是企业自己宣布的，而是整个行业自然形成共识。

目前具身智能还处在非常早期阶段。真正成熟的产品范式，其实还没有出现。但有一点是确定的：AI 一定会进入物理世界。

网易科技：AI 进入物理世界是不是得靠世界模型？您怎么看当下最热的“世界模型”？

刘知远：世界模型这个方向一定是对的。AI 最终一定要从全模态、走向物理世界，建立起对世界的建模能力，并能够预测世界下一步是什么。

今天相关技术路线之所以这么百花齐放，原因在于还没找到真正的实现路线。

在这种时候不能盲目迷信某一条路线。学者可以有自己的坚持，但对于一家商业公司来说，更重要的是保持谨慎和开放。因为如果过早重仓某一条技术路线，而最后路线判断错了，可能会陷入非常大的困局。

对于这种高度不确定的前沿方向，我们更倾向于采用：企业有限投入，实验室开放探索，高校协同研究这样的方式进行。其实，智源研究院这样的科研机构很适合做这样的工作。

核心目标是：无论最终哪条技术路线成立，我们都能够第一时间识别这个信号，并且快速进入。

最好的情况当然是这条路线由我们自己率先找到；但即使不是，我们也希望成为全球最早跟进、最早投入的一批团队。这是我们对于世界模型方向的整体策略。

创业、教育与AI时代的人

网易科技：您作为教授在清华带学生，又是面壁智能创始人和首席科学家。您怎么平衡学界和产业界这两个身份？

刘知远：这其实是一个水到渠成的过程。

2018年以前，人工智能还处在“专用智能”阶段。那个时候，它距离真正进入社会、产生大规模价值还很远，很多探索更适合发生在高校。

但2018年之后，随着预训练技术出现，人工智能正在快速迈向通用智能。在这个阶段，它一定会进入产业、进入社会，并真正创造价值。既然它已经开始真正“有用”，那它最前沿的探索，也一定会发生在产业一线。

这也是为什么，我觉得必须去参与、甚至创立一家企业，去做最前沿的大模型研发。只有站在那个前沿位置，你才有机会继续推动真正大的创新。

另一方面，我在高校的使命是培养人。

但如果我的学生从来没有参与过世界最前沿的大模型研发，那他们很难成为真正第一流的人才。

所以这件事对我来说，并不是一种割裂，而是一个非常自然的发展过程。

美国的 Berkeley、MIT、Stanford这些顶尖高校，它们和产业的结合都非常深。

因为计算机科学既是科学，也是技术。

而技术最终一定要服务社会。如果一个技术没有人愿意为它付费，那它很难说是真正有价值的技术。

网易科技：从学者转型创业者，您觉得最大的挑战是什么？

刘知远：管理本身其实不是最大挑战。真正大的挑战在于：学术界和创业世界，对“创新”的容忍度是完全不同的。

在学术界，只要你的东西足够新、足够前沿，大家就会认可你、尊重你。你做得越难、越超前，往往评价越高。

但创业不是这样。当你开始和投资人、产业链、商业体系打交道之后，你会发现，世界一下子复杂了很多。

你既要坚持创新，因为这是未来真正重要的东西；但又必须在当下活下来。很多时候，你做得太新，别人甚至都无法理解你的价值。

比如2021、2022年我们去聊大模型时，很多投资人根本听不懂我们在讲什么。他们最关心的问题是：怎么赚钱？商业模式是什么？但那个时候，连技术本身都还是新的，更不用说商业模式。

所以后来我会越来越觉得，创业其实特别像一种“理想和现实之间”的平衡。既要有远大的目标，又必须活在当下；既要坚持方向，又要找到穿越周期的方法。

网易科技：AI 的发展对教育提出了非常大的挑战。作为老师，您应该会经常被问到一个问题：AI 时代的人才如何培养？

刘知远：这个问题我作为老师确实经常会被问到。

清华非常重视 AI 到来之后教育范式的变化。一方面，我们会积极探索怎么用 AI 更好赋能教育；但另一方面，我们也在思考：智能时代真正的高端人才，到底应该具备什么样的品质。

我自己的理解是，其实和高校过去希望培养的人才是一脉相承的，只是重点发生了变化。我觉得未来高端人才至少需要具备三个能力。

第一，是把 AI 当成工具的判断力。未来每个人一定都会大量使用 AI 工具。但关键不在于“会不会用”，而在于你有没有能力判断 AI 给出的结果到底对不对、好不好、该不该相信。

第二，是组织 AI 的架构能力。我经常提 OPC（One-Person Company）。未来很多人不一定是一个人在工作，而是一个人带着很多 AI Agent 一起工作。

这个人更像一个 CEO，他负责调配这些 AI 员工，让它们协同完成任务。未来不一定只是 OPC，也可能是 OPL（One-Person Lab），一个人带着很多 AI Researcher；甚至可能是 OPD（One-Person Department），一个人就是一个部门。

所以未来非常重要的一件事，不再是“亲自干活”，而是如何组织 AI、调度 AI、协调 AI。

组织能力、架构能力，会变得越来越重要。

第三，是基于 AI 的创新能力。创新仍然会是未来人类最核心的能力。AGI 的终极目标，某种程度上也是让 AI 获得越来越强的创新能力。但我始终认为，“人 + AI”的创新，依然会强于纯 AI。

网易科技：越来越多的趋势表示，AI 会替代大量工作。

刘知远：我觉得这个趋势一定会发生。很多职业会被 AI 替代，短期内一定会带来阵痛。而从更长的人类历史来看，这是技术革命的必然结果。

比如“computer”这个词，最开始其实是一种职业，专门负责做计算的人。当年这甚至是一个很体面的工作，每天坐办公室里做计算。后来电子计算机出现，这个职业就消失了。

今天其实也是一样。接下来几年，AI Coding 可能会让很多初级程序员受到冲击。但从更大的视角来看，把人类从机械重复的脑力劳动中解放出来，本身是技术进步的重要意义。

人不应该永远被困在重复劳动里。不要内卷，要“向外卷”。

总之，从局部来看，它一定会带来调整，需要社会、政府一起去解决就业和转型问题；但是从整个人类社会发展趋势来讲，把人类从机械重复劳动当中解放出来，这是一件有利于人类幸福的事情。

手机 / 数码

房产 / 家居

独家对话智源学者刘知远：中国AI要向外卷，而不只是做第二个OpenAI

中国AI要向外卷，而不只是做第二个OpenAI

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

上赛季差点降入英甲，下赛季要踢英超了

台媒贴脸！S妈被问大S嗑药当场沉默

中国铝行业爆单 下一个“煤炭”大周期？

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

外泌体抗衰，什么时候能用上？

招商地产接盘碧桂园！海口这个烂尾豪宅，要彻底改命？

用云锦的方式，打开江苏南京

漫步虎山公园 邂逅泰安初夏的温柔

25岁海归男恋上32岁离异女因88.8万彩礼闹掰追讨12万

25岁海归男恋上32岁离异女因88.8万彩礼闹掰追讨12万

中国铝行业爆单下一个“煤炭”大周期？

涉水加强福特烈马亚马逊限量版上市售价39.98万

漫步虎山公园邂逅泰安初夏的温柔