网易首页 > 网易号 > 正文 申请入驻

用物理定律训练AI,在数据稀缺中寻找科学答案:对话耶鲁大学陆路

0
分享至



当 AlphaFold 为蛋白质结构预测摘得诺贝尔奖,当气象大模型开始逼近甚至超越传统数值天气预报的精度,当 AI 驱动的自动化实验室在全球顶级研究机构遍地开花,“AI for Science”正以前所未有的速度重塑科学研究的范式。

2025 年,《Nature》发布的 AI for Science 专题报告指出,物理信息神经网络(PINNs)等知识引导的深度学习方法,正在显著增强模型的泛化能力和可解释性,成为这场变革中的关键技术路径之一。

而在这条路径上,耶鲁大学统计与数据科学系、化学与环境工程系助理教授陆路(Lu Lu),是最具代表性的青年研究者之一。2025 年 9 月,他入选麻省理工科技评论“35 岁以下科技创新 35 人”亚太区榜单(TR35 Asia Pacific)。

陆路本科毕业于清华大学热能工程系,后赴布朗大学攻读应用数学博士,师从计算力学领域的顶级学者 George Em Karniadakis 教授。

他的研究横跨科学机器学习的理论、算法、软件与应用:他与导师共同提出的深度算子网络 DeepONet,发表在 Nature Machine Intelligence 上,开创了用神经网络学习无限维函数空间之间映射的范式;他开发的开源库 DeepXDE,是目前最广泛使用的物理信息神经网络工具之一,发表在 SIAM Review 上,成为该刊被引用和阅读最多的文章之一;他在镰刀型细胞贫血症的定量预测上的工作发表于 Science Advances,在材料力学性质提取上的工作发表于 PNAS。

近年来,他还将研究拓展至多保真度算子学习、量子加速神经算子(Quantum DeepONet)等前沿方向,并获得美国能源部 400 万美元资助,领导开发联邦学习的科学基础模型。其 Google Scholar 引用量已超过 26,000 次。

在当前大语言模型和生成式 AI 主导公众注意力的背景下,科学计算领域的 AI 革命同样深刻却往往不为大众所知。我们与陆路进行了一次深度对话,从他个人的学术成长出发,聊了聊科学机器学习到底在解决什么问题、为什么物理知识和数据需要结合、AI 在科学研究中能否成为真正的“协作者”,以及他对中美 AI 科研差异的观察。

用AI重新定义科学计算:对话耶鲁大学陆路,DeepTech深科技,47分钟

以下为对话全文:

DeepTech:我们今天邀请到了 TR35 亚太区 2025 的入选者陆路老师,来聊一聊他的成长故事和他所做的事情。下面请陆老师先跟大家打个招呼。

陆路:大家好,我是耶鲁大学的陆路,我现在做的工作我们称之为 Scientific Machine Learning,或者叫 Physics-Informed Machine Learning,中文翻译是物理信息机器学习,或者叫科学机器学习。它的一个特点是需要结合多方面的背景。

首先这是一个机器学习的方法,自然需要计算机相应的背景。然后像我的研究,主要是把这一类方法开发出来,用来解决很多科学计算里面的问题,所以又需要很多数学背景。当我们开发了很多方法之后,我们会希望把这些方法用来解决实际的工程问题或科学问题,所以在很多实际的应用场景中,又需要很多工程的背景。这就跟我过去很多年的教育背景以及所学的专业有关。

我在清华的时候,专业是热能工程系——现在大概是 2017 年左右改名,叫能源与动力工程,属于机械学院下面。所以我本科时就有很多工程的背景。同时我当时选修了经济学双学位和计算机辅修,所以也有很多计算机方面的背景。后来到布朗大学,我一开始也在工程学院,上了很多工程学的课。后来转到应用数学,同时也在修计算机的硕士。学了这么多之后,发现这些东西在我的研究中全都用上了,我觉得还是挺开心的一件事情。

DeepTech:你从热能工程然后又转到计算机、又转到数学,是什么样的动因驱动你做这些专业方向上的选择?

陆路:我一开始高考之后选专业,其实当时也没有做太多思考,觉得热能工程这个方向感觉挺有意思的,而且能解决很多实际的问题,所以选了这样一个工科方向。但是在学习的过程中,包括本科时做的一些科研,发现很多时候会需要计算机的支持。特别是我当时对建模仿真这方面感兴趣,本科时也做过一些实验,但我对实验好像不是很擅长,做得不是特别好,所以一直喜欢做模拟仿真。当时就同时选修了计算机的辅修。

在布朗的时候,我一开始在工程学院,但主要感兴趣的还是做计算机模拟,而不是做实验。当时我很感兴趣的一位老师,就是我后来的博士导师 George Karniadakis,他在应用数学系。所以我后来很自然地把学位从工程转到了应用数学。我一开始的研究也没有做机器学习。

在我博士的前几年,大概是 2014、2015 年,我主要做的东西简单来说是和分子动力学相关的。我们会用分子建模的方式来模拟一些生物现象。当时我们做了很多高性能计算,会写 C++程序,用并行的超算来进行大规模模拟。这些能力需要上很多计算机底层的课,才能让自己写的算法跑得非常快、非常好。所以当时学了很多计算机方面的知识。很多时候可能也是跟我的兴趣有关,我对用模拟、建模仿真、计算的工具来解决应用数学或者工程方面的问题一直比较感兴趣,所以它就同时需要多方面的背景。

DeepTech:所以其实你转向计算机也好、转向应用数学也好,在你转向的过程中,AI 技术其实还没有大范围普及开来,或者当时还属于一个低谷期。

陆路:对,是的。一开始的时候大家还没有认识到 AI 有多么有用。现在大家都在做 AI for Science,用 AI 来解决科学中的问题。但当时 AI 还处于很早期的阶段,包括计算机视觉都还没有发展很好。所以那时候我一开始也没有想到后面要做 AI。但是我学了这么多东西,后来发现这些知识,计算机也好、应用数学也好,都自然而然地用在了我现在关于 AI 的研究中。

DeepTech:那在这个转向过程中,你有没有遇到过一些困难?因为我也是学自然科学的,学生物相关的,通过生物去研究计算机相关的知识和领域进展的时候,对于我来说属于跨学科,会遇到各种各样的困难。对于你来说有没有这样的经历?能不能分享一些怎么克服这些困难的经验?

陆路:我觉得你说得对,确实是跨学科工作的一个基本问题。跨学科很多时候需要更多的付出。比如我刚才提到,本科的时候做的东西是和传热流体相关的。后来在读博的头几年,我用的方法叫 DPD(Dissipative Particle Dynamics),大概来说就是用分子动力学的方式,当时模拟的现象是红细胞、血红蛋白这个尺度。我们希望用计算机模拟去理解红细胞到底是怎么工作的、怎么调控的、它的力学性质怎样。我们当时还考虑一个疾病叫镰刀型细胞贫血症,这个可能大家在高中课本上学过,去理解这个疾病到底怎么发生的,它怎么和药物进行交互,为什么有些药能够产生效果。

这个课题一开始我上手花了一段时间。因为这是一个生物问题,我之前也没有学过;用的工具是分子动力学这类工具,本科时也没有学过。所以一开始读了非常多的文献,花了很多时间去进入这个领域。我记得特别深的一件事是,当时我需要用一个软件叫 LAMMPS,一个非常多人使用的分子建模软件。但 LAMMPS 不是很容易上手,不像比如现在我们用 TensorFlow、PyTorch,教程非常完善,网上例子非常多,API 也很简单。

LAMMPS 是一个 C++代码,代码量非常大,文档写得也不是那么友好,至少在当时。我记得我一开始的时候把几百页的文档打印出来,从头到尾读了三遍,终于把这个软件怎么工作的、底层实现原理是什么搞清楚了。因为我们需要进入这个代码本身做很多非常底层的修改。所以感觉一开始还是经历了一些比较痛苦的时期来进入这个领域。

DeepTech:但是经过一段痛苦的时间之后,对你的科研工作其实是有帮助的。

陆路:对,我觉得有几方面。一个是不仅知道了这个问题怎么做、工具怎么用,另一方面也是对我本身能力的一个培养。

DeepTech:对你来说,这样也有助于了解更底层的运行原理,对科研工作是一个助力。

陆路:对,我现在已经不做这个方向了,但我觉得当时的很多积累和思考对后面的工作都是有帮助的。

DeepTech:你现在转向机器学习,这个过程是不是就比较顺畅了?

陆路:从我的经验而言,其实机器学习的上手,进入机器学习这个领域,比那些传统领域,比如我刚才提到的分子动力学,要简单很多。不管是读文章也好,自己写代码也好,确实非常容易上手。

DeepTech:其实这个时候你已经写了十几年的代码了。

陆路:对,也可能是我自己能力提高了,不一定是这个领域简单。

DeepTech:刚才你提到你是用机器学习的办法去解决一些物理的问题和数学的问题。你能再给我们介绍一下你的科研方向吗?因为我们的播客偏向的受众还是相对大众一些的,希望能够让大家听懂你的研究内容。

陆路:首先说一下我的目标,我们到底要干什么。我一直感兴趣的就是仿真建模,我们有很多不同的生物现象、物理现象,比如刚才提到的血液的流动,或者对飞机、汽车进行建模,或者天气的预测。这些复杂的系统,我们希望找到一个工具能够对它进行预测,以便更好地进行控制和优化。

如果我们考虑传统的计算方法,基本上就是写方程。比如说血液的流动,我有一套方程把它写出来,里面可能有很多参数,我自己选一些参数。这样建一个完备的系统,不需要任何数据,用代码或某种数学方法就可以求解这个系统,知道它会怎么发展、有什么性质。

DeepTech:这就是你之前说的用超级计算机去解这些方程,对吧?

陆路:对,是的。但这里面会有很多问题。比如我要对血液进行模拟,但血液是一个非常复杂的现象。当我们想用方程来描述,可能没有一个非常完美的方程来模拟血液。即使把方程写出来,里面可能有很多未知项、很多参数,我也不知道该怎么选。所以传统方法就有各种各样的限制。同时用超算来算非常贵。

DeepTech:超算的计算时间也很长。

陆路:对,所以我们就希望用机器学习的方式来解决这些难点。说到机器学习,大家经常会想到数据驱动或大数据。很多时候,比如我有一个复杂的系统,方程我可能不完全知道它长什么样,但我可能有一些知识,我们过去有很多积累,大概知道怎么用数学语言去描述,但可能不是百分之百准确。同时我们可以对这个系统收集很多数据。所以我们就希望结合过去已有的科学知识加上收集的数据,两者结合来进行建模,而不只是从物理出发。

这就是我们称之为 Physics-Informed Machine Learning(物理信息机器学习),把物理信息和数据结合在一起来进行建模。这样也会解决一些其他问题,比如一旦神经网络训练好之后,它的预测能够非常快,而不需要超算。举个例子,我当时做模拟的时候,印象非常深刻,那时我跑的一个系统非常大,为了追求较高的精度,用了超过 20 亿级别的粒子数来求解。当时我用的是美国排名第一的超算,用了它大概三分之二的资源来跑那个程序,但结果也没有那么理想。有了机器学习之后,虽然训练可能很贵,但训练完之后用来预测新的情况、做其他任务就非常方便了。

DeepTech:能不能再给我们解释一下,传统是解方程,那现在是让 AI 去解方程,还是说用 AI 只是映射方程的结果呢?

陆路:你这一点说得非常好。现在其实有多种做法。一种是用 AI 来直接解方程,舍弃传统的解方程算法,只用 AI 来解。另一种是不用 AI 做求解过程,而是用 AI 直接一步做预测。

DeepTech:直接输出结果。

陆路:对,这两种我们都有做。现在的科学界这两种都有大量的人在做,甚至还能相结合。

DeepTech:你主要选择哪种方法?

陆路:像好几年前,特别是我在读博士的时候,我一开始做的是第一种:我有一个方程,可能是各种形式、不同的问题。比如我们称之为正问题或者反问题。我最初的研究主要偏向于用 AI 来解正问题和反问题。所谓正问题,比如直接对血液进行模拟;反问题则是它的反面,比如我有一个材料,有一些力学性质,有一些观测值,这些观测值可以认为是方程的解,我已经有了一些解,但希望反过来预测材料的性质,也就是反过来预测方程中缺失的一些信息,这就称之为反问题。

我们一开始做的比较多的是开发一些 AI 算法来解正问题和反问题,特别是反问题。当时取得了一些进展,有些问题上比传统方法做得更好。后来,特别是博士最后一年到现在,我的研究方向更多集中在用 AI 来直接预测方程的解。我们称之为“算子学习”,因为预测方程的解可以称之为一个解算子,所以叫算子学习。

DeepTech:本质上相当于训练完模型之后,让 AI 直接去预测某一个方程的解,或者直接预测某些数据,输入之后直接输出结果,对吧?那这个模型在训练的时候是不是也需要大量的数据?

陆路:这个问题非常好。训练有很多种不同的方法。第一种最直接的方法就是先产生数据,这个数据可以用 AI 来产生,也可以用传统方法来产生。产生数据之后做训练,这是比较自然的想法,类似于现在做 ChatGPT 训练一样,先产生数据然后做训练。这种好处是两步分得很开,研究起来比较简单。

但问题在于很多时候产生数据的过程计算量很大。不像自然语言,我们可以把网上数据全都爬下来就可以训练。科学数据很多时候需要跑模拟、跑仿真去产生。所以有另一种方法,我们称之为 Physics-Informed 的方法,在训练过程中,可以产生一些数据,但不需要那么多,产生一些小数据。同时在训练过程中,把一些物理知识也作为训练的一部分。比如我们知道训练的结果是某个系统的预测,那么这个预测要满足一些物理规律,这些物理规律就可以作为训练过程中的一种约束。这样就可以减少对数据的依赖。至少在我的研究中会更多地采用这种方法,不完全抛弃物理知识,还是会把它加进来。

DeepTech:相当于如果让 AI 自己去收敛,肯定需要非常大的数据才能出现准确的预测结果。如果加入一些物理规律的约束或规则约束,可能不需要大量的数据样本。因为我也知道自然科学的数据,第一细分得非常细,第二获取非常难。这样的话就不需要大量的数据去喂它了,建立了一些规则之后,它在规则的基础上去跑这些数据,可能就会得到更优的结果。

陆路:对,其实怎么解决数据的问题,我们最近做了很多工作。一种是我刚才提到的,把之前的知识,数学方程也好,或者最基本的质量守恒、能量守恒等都放在训练过程中去。当然我们还有很多其他做法。比如我们有一种方法叫 Multi-Fidelity Learning,中文可能翻译叫“多保真度机器学习”。这个概念不是新的,但它和机器学习结合能产生一些很意想不到的结果。

举个简单例子,比如我要对某个现象进行求解,需要产生数据。但数据产生有很多种方法,我可以用很多算力得到非常准的数据,但这种数据很难获取,可能很少,我们称之为 High Fidelity,就是高保真度数据,非常准但非常少。另一种做法是产生数据时不需要那么准,可能差 10%、差 15%,就大概有一个趋势。产生这样的数据相对简单,会产生大量的这种数据,我们称之为 Low Fidelity,数据量庞大,但每个数据质量较差。

我们这个方法可以想象成一个金字塔结构:越往上数据精度越高越好,越往下数据质量越差。但好的数据在金字塔顶端数量很小,差的数据在底端数量很多。这个方法就是说,我们有这样多级别的数据,希望把它们全部用起来,通过机器学习的方式融合在一起,得到一个非常好的模型。这个模型会比你只用少量精确数据、或用同等计算代价获得的结果要更好。

DeepTech:这样数据的问题就相对好解决一些了。

陆路:对。像我提到的这是一种策略,其实我们还有很多其他的策略。比如我们最近有一篇文章发表在 Nature Communications 上,考虑了一个非常有意思的极端情况,如果在某个时刻你只有一个数据,你怎么去对这个数据进行学习。这在有些应用场景中确实会出现。

当时我们举了一个例子:比如新冠疫情的时候,大家去预测传染疾病的发展。有一个所谓的 SIR 模型,大概可以预测不同人群,比如受感染的人群、恢复的人群之间的交互。比如一个人被感染后可能又恢复。但这种模型没有考虑到不同的人口密度或人的迁移率。比如我们考虑上海或北京,它的动力学性质跟人口更稀疏的地方,比如内蒙古,肯定是不一样的。所以有一个更准确的模型会考虑人口分布和迁移速率。可以想象,如果每个人每天迁移的距离更多,疾病其实更容易传染。

如果考虑这种情况,比如政府要做一个预测,要不要限制大家外出,限制到什么程度,那我们可能就想知道一个政策会对应怎样的结果。收集数据就是需要对某个城市的人口或当时某个阶段的情况进行调研,这样的数据收集起来非常麻烦,不可能收集好多次。可能政府花了很大精力收集了一次数据。用我们的方法,只收集一次数据,做一次普查,就可以对系统进行分析。如果有一个新的政策,模型就会告诉你对于这个政策,疾病会怎么发展;政策更宽松或更收紧,会导致什么结果。所以实际中确实会有一些具体的应用场景,数据会极度稀少。

DeepTech:这样我们让数据的收集者也减轻了压力,同时能够给出不同政策下的预测结果,有利于决策,而不是反复收集动态数据。动态数据的获取确实非常困难。

陆路:是的,我当时考虑的就是有些场景中收集数据,特别是动态数据、长时间的数据,代价是非常大的。

DeepTech:你刚才提到不管是小样本学习,还是利用规则去收敛学习路径,就会带来另一个问题,我们都知道在机器学习中可能会产生过拟合的现象,也会出现很难解决长尾问题的情况,就是极端情况下预测失真。你如何判断,你训练完的 AI 模型是真正捕捉了底层的物理规律,还是一个过拟合的结果?

陆路:这个问题非常好。一般来说机器学习是数据驱动的,很多时候模型的效果取决于你用什么样的数据去训练。

DeepTech:以及数据质量。

陆路:对,数据质量、数据的范围。在我们这套方法中,可以加入物理信息,很多时候能使模型的泛化做得更好,改善性能。但从理论上来说,很多时候我没法保证它一定能处理任意的输入。比如你提到的长尾数据,确实是一个非常难的问题。

所以我和我的很多同行会做这样一件事情:我承认我这个模型训练好之后没法处理任意的输入,但我们想知道模型怎样能够更加鲁棒(robust)。比如有一个新的输入进来,如果我的模型能够探测出这个新输入它能不能准确处理,如果模型自己知道这个输入我能处理,就直接预测输出;或者直接告诉使用者,这个输入我不知道怎么做。所以我们也有一些工作,不是一定要使模型能够处理任意输入,因为确实非常难,会有一些极端情况在训练时很难考虑到。

DeepTech:那这种输入,模型会自己识别出来呢?还是有可能会输出假的结果,或者偏离正确值太远的结果?

陆路:这种方法某种意义上还是有一定概率在里面的。对于一个输入,很多时候我没法百分之百保证模型能否正确预测。但我们很多时候能做的是在概率上,有非常大的概率让模型知道它是否有能力处理这个数据。同时在设计的时候,可以加入一些人工因素,比如设置一些参数,让模型对输入更保守或更激进,可以根据需要去调节。但确实也不能做到百分之百,可能是 99% 或者很大概率能够正确。

DeepTech:那这个模型有没有一些验证的手段?比如我们知道在自动驾驶里,过去模型的决策链路我们是看不到的,现在新的发展方向是加入了语言处理,通过语言来了解模型的决策是否正确。在进行科学研究的时候,我们一般也认为模型是一个黑箱,它的可信度和结果的可追溯性怎么样?

陆路:这方面其实有很多研究。像我做的和 PDE(偏微分方程)相关的场景,我们有一些办法去追溯,比如可以知道模型的输出为什么会这样输出。但这个领域没有一个方法能保证百分之百是对的。所以很多时候使用模型的人,可能还是需要理解模型它为什么会有这样的输出。比如在做决策的时候,模型告诉我输出是某个值,同时可以告诉你一些辅助信息,模型为什么会有这样的决策。但这些解释性的反馈也不一定能保证它是对的。

像我们在解 PDE 方程的领域,当和传统方法相比的时候,传统的数值方法有非常严格的理论保证。像机器学习的话,很多时候我们只能在概率上给出一个保证。比如训练完之后,我说很大概率是对的,或者在某种覆盖率的情况下是对的,或者精度大概是多少。我永远不能告诉你百分之百能达到什么程度。我觉得这可能是机器学习范式的一个固有问题。

DeepTech:在概率的情况下,永远不可能保证百分之百的准确。

陆路:对,其实现在比如说 ChatGPT 或者 Gemini 或者其他大模型,已经越来越好了,大部分时候是对的,但也没法保证回答百分之百正确。

DeepTech:有没有出现过这样一种场景,你觉得大概结果应该往某个方向走,但经过 AI 的计算或分析后,它给出了截然不同的结果,或者意想不到的结果,而你去验证后发现 AI 给出的结果反而是正确的?

陆路:这是一个非常有意思的事情。我们最近正在做的一个课题,前两周我们想用机器学习去预测一个关于地球物理的问题。当时机器学习的结果我觉得很奇怪,跟我们的一些直觉不大一致。后来我们发现原因在于,机器学习模型没有问题,而是我们产生数据的模型有问题。所以很多时候机器学习的结果有时候会出乎意料,但并不是模型的问题,可能是反而我们对问题产生了一些理解上的错误,或者我们之前的建模方式哪里有问题。

DeepTech:所以当我们把传统领域或学科引入 AI 场景之后,AI 不仅仅是一个解题的工具,不像过去超算只是解方程的工具,它甚至能够在某些程度上成为我们的协作者,能够提供一些结果上或者预测方向上的信息。

陆路:对,其实这一块也有很多不同的方法。比如还有一类问题是怎么用 AI 去发现新的物理知识。很多时候我们以前的知识可能是手动推导出来的,但现在有了 AI 这个工具,可以用 AI 自己去发现一些我们以前可能没有想到的东西。

DeepTech:学物理的同学都会有一个执念,追求大一统,完成一个收敛的过程。刚才咱们聊的过程中,我大概记了几个应用方向,地球物理、传统的生物学、流体动力学。这几个应用方向在我们看来都是相对传统的领域。把你这样一些新的研究范式引入传统学科里,有没有遇到什么阻力或困难?

陆路:阻力可能说不上,因为像我这些研究,很多时候我也不是某一个方面的专家。比如说我也不认为我是地球物理方面的专家,我一般会找很多合作者。在不同的科学领域,有很多人对 AI 帮助他们进一步提高、解决他们的问题,持着非常开放的态度。所以倒没有特别有阻力,但会有一些地方遇到问题。

比如最近有一篇文章,我们研究的是一个生物问题。简单描述就是我们的心脏可能会有各种疾病。如果心脏生病了要做手术,医生在手术前需要知道心脏现在属于什么状况,因为不同的状况要采取不同的手术策略。

以前大家会根据医生的经验,首先对心脏做一些成像,CT 也好、MRI 也好——然后医生看这些成像照片,根据经验或一些传统方法去推断。但这样其实非常难,可能也会有错误,精度不一定高,依赖于医生的经验。

所以我们当时用 AI 来做这件事,提出了一套方法。我们是第一个用 AI 来做这个具体问题的。当时我们还把技术用在了一个真实的病人身上,因为我和医院的一个同事合作,他当时有一个小病人。我们预测完之后和传统方法对比,发现我们的方法确实在某种意义上更好。

但问题在于,做传统方法的人会质疑:你这个 AI 预测出某个结果,可能和传统结果不完全一样,你怎么知道你的方法是对的?

DeepTech:很多医学上要求循证。

陆路:对,因为当时是一个真实的病人,我们不可能把真实病人的心脏取出来做实验,然后说你看真的和机器学习预测是一致的。在文章里我们可能先用虚拟病人的模拟数据来验证方法是对的。但到了真实病人身上,很多时候没法说一定是对的。所以在一些特殊情况下,比如医学领域,会有这样的问题,传统数值方法有理论保证,大家自然觉得是对的。到了 AI 之后,不是一步一步人工推导的,怎么去解释结果是对的,我们可能会有一些解释,但要完全说服别人,需要更多时间。

DeepTech:所以引入到传统行业的时候,我们也需要传统行业的专家来合作,进行结果的验证和保证,这样才能在各行各业里去应用,尤其是相对严肃的领域,比如医学。

陆路:对,比如刚才提到的那个案例,我的合作者是一个医院的医生,他真的会做临床手术。他当时对这个结果觉得非常好。

DeepTech:所以 AI 也可以成为医生的高效率工具。医生并不希望每天通过看片来得出结论。如果我们能很快预测出结论,医生只需要判断对错就好,而不需要一步一步用经验去推导结果。他从一个执行者变成了一个决策者。

陆路:对,我觉得当我们用在各种领域的时候,还是需要领域内的专家大家一起合作。

DeepTech:目前我们在科学上的研究,与各大厂竞争的语言模型或多模态模型,有差异吗?有没有一些交叉?

陆路:像大厂做的语言模型和其他模型,跟我做的科研应用方面的模型,我觉得既有差异又有共通点。很多技术其实有相似性,比如 Transformer 一开始是为语言模型开发的,但我们现在也把它用来做科学计算。所以很多技术可以借鉴过来。但也有很多不一样的地方,比如数据,他们有海量数据,但科学领域或工程领域很多时候数据量很少。同时我们有一些他们没有的东西——

DeepTech:就是什么是正确、什么是错误的绝对标准。

陆路: 对,传统的科学领域有正确和错误的标准,工程领域也有不同的先验知识。有了这样的额外信息,我们就要开发额外的算法和机器学习模型。所以它们在技术上有很多可以借鉴的地方,但也有很多不一样的东西。

DeepTech:大厂的这些模型能用到科学里吗?

陆路:其实有一些是可以的。比如现在大家都在做 Foundation Model(基础模型),我们如果做科学应用,大家现在也有做很多科学基础模型。最经典的例子,我们知道做蛋白质的就有很多这样的模型,大家已经做了好几年了。它们的技术和大厂做的非常像,因为比如一个蛋白质序列可以看作一种语言。

DeepTech:反正都是一个序列。蛋白质序列和语言文字其实是差不多的。

陆路:对,所以很多时候有非常多的东西可以借鉴过来。我经常也会看做语言的、做计算机视觉或其他多模态的文章,也会借鉴很多他们的技术。

DeepTech: 聊完技术之后,还想聊一些更开放的问题。因为你也是从国内毕业之后到美国做研究,后来独立带团队。你觉得两国的科研环境,或者对 AI 相关技术的发展,有什么切身的感受?

陆路:像我本科毕业到现在超过十年了,其实我对国内现在的科研方式没有那么了解了。但一般而言,差异肯定还是有的。

如果在 AI 领域不看具体细节,只看整个发展的话,我们可以看到很多新闻显示中国的 AI 发展非常快,特别是最近几年。不管是文章的数量,还是大厂模型的开发。虽然起步没有美国那么早,但最近发展特别快。但如果我们只看那些最有突破性的工作,至少到目前为止,这样的数量在美国还是更多一点。

DeepTech:基础研究或者基础性的科学研究。

陆路:对,但我觉得未来几年肯定会变化。如果看趋势的话,国内现在不管是投入还是人才储备也越来越多了,以后肯定能看到越来越好的工作出现。

DeepTech:从读书到带团队的身份转换,你觉得有什么不同吗?

陆路:差别挺大的。自己读书的时候专注的就是自己的课题,把手头一两个课题做好就行,其他什么都不用管,比如经费是怎么来的我也不用管,只关心自己的研究。

但独立之后就不一样了。特别像在美国,我要招学生的话,就要给学生付学费、付工资。这一点跟国内挺不一样的。在国内老师招一个博士生,如果只从经费层面来看,没有那么多。但在美国非常贵。大概一个平均数字,不同学校差很多,但平均一个学生一年大概要 10 万美元。

DeepTech:还蛮贵的。

陆路:像耶鲁就更贵了,因为一般来说私校学费更高、工资也更高,学校所谓的 Overhead(管理费)也更高,比这 10 万要多很多。所以独立之后带团队,除了要做好科研,和学生讨论科研怎么做、文章怎么写,另一个非常重要的事情就是怎么去找经费。有了经费,才能给学生付工资、付学费,支持他们的科研。

DeepTech:我们今天聊了很多,从你的技术研究到拆解技术细节,陆老师把技术讲解得非常清楚,也带我们了解了 AI 解决科学问题的很多洞见。最后也聊到了科研和带团队的差异。最后请陆老师再总结两句。

陆路:我可以说一下最近的一些其他方向。我一直在做的是从传统模拟做了好几年,然后转到机器学习,用 AI 解方程、做建模仿真、做预测。现在我也在做一些新的工作。比如我最近开始做 AI 和量子计算的结合,怎么用量子计算来加速 AI,去处理我以前的那些问题。

另外我们也知道最近有一个非常热门的领域叫生成式模型。比如在 ChatGPT 里可以用语言来生成一只狗、生成一幅画。如果把这类模型引入传统的科学计算领域,当然可以直接用,但范式上会有一些区别。所以我们最近也提出了一些不一样的策略,怎么把生成式算法更好地和物理信息相结合。

还有我们最近的一些其他工作,希望把 AI 这个工具反过来和传统的数值方法相结合,使得我们既能有 AI 的优势,比如速度很快,同时又能保留传统方法的准确性和理论保证。我们能不能两者兼得?这也是我们最近的一些新的研究方向。

DeepTech:好,有感兴趣的听众朋友也可以跟我们联系,与陆老师进行进一步的交流。

陆路:好的,我的邮箱在网上都可以找到,如果大家感兴趣,欢迎联系我。

DeepTech:感谢陆老师的时间,谢谢!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没有预兆,张本美和突然官宣告别,发声透露原因,哥哥也被打懵

没有预兆,张本美和突然官宣告别,发声透露原因,哥哥也被打懵

海棠未眠a
2026-02-10 17:23:58
比存储还猛?IGBT龙头英飞凌全球涨价  这十大国产龙头也即将涨价

比存储还猛?IGBT龙头英飞凌全球涨价 这十大国产龙头也即将涨价

元芳说投资
2026-02-11 06:00:15
辛芷蕾方开撕微博风波升级!娃娃被偷再添实锤,杨幂大粉帮倒忙!

辛芷蕾方开撕微博风波升级!娃娃被偷再添实锤,杨幂大粉帮倒忙!

古希腊掌管月桂的神
2026-02-09 15:13:16
恩爱相伴26年,75岁张艺谋再次官宣新消息,陈婷嫁对了人

恩爱相伴26年,75岁张艺谋再次官宣新消息,陈婷嫁对了人

丁鸊惊悚影视解说
2026-02-11 05:36:29
新帅新援新阵又如何!申花、蓉城2026年亚冠首秀遭开门黑

新帅新援新阵又如何!申花、蓉城2026年亚冠首秀遭开门黑

南方都市报
2026-02-10 23:32:07
航行警告!南海海域进行火箭回收作业

航行警告!南海海域进行火箭回收作业

每日经济新闻
2026-02-10 12:33:37
赚美国钱回中国花?卷走美百亿巨款被判465年,他堪称最牛企业家

赚美国钱回中国花?卷走美百亿巨款被判465年,他堪称最牛企业家

嫹笔牂牂
2026-02-09 14:19:54
5胜4平,曼联连续9场联赛不败为目前英超球队最长

5胜4平,曼联连续9场联赛不败为目前英超球队最长

懂球帝
2026-02-11 06:37:29
若没刘居英,抗美援朝结局或改写!他曾提过一个建议,总理:同意

若没刘居英,抗美援朝结局或改写!他曾提过一个建议,总理:同意

芊芊子吟
2026-02-02 15:15:03
63岁穆帅狂喜!100分钟遭绝平 葡超巨无霸2轮丢5分:本菲卡有希望

63岁穆帅狂喜!100分钟遭绝平 葡超巨无霸2轮丢5分:本菲卡有希望

风过乡
2026-02-10 07:23:12
赚流量也要有个限度!网红晒老婆产子过程,露胸、带货引人不适

赚流量也要有个限度!网红晒老婆产子过程,露胸、带货引人不适

削桐作琴
2026-02-10 19:06:38
山姆刺破年份酒泡沫

山姆刺破年份酒泡沫

中国能源网
2026-02-10 08:38:07
奥运女首金原来是杭州人,退役后定居美国,68岁她仍关心浙江体育

奥运女首金原来是杭州人,退役后定居美国,68岁她仍关心浙江体育

冷紫葉
2026-02-10 18:23:00
段鹏73岁临终前说出隐情:魏和尚的死,不是被土匪杀死那么简单

段鹏73岁临终前说出隐情:魏和尚的死,不是被土匪杀死那么简单

呆子的故事
2026-02-10 14:39:50
第8艘!美军空降印度洋,抢15万吨中国香港油轮,针对中俄古委伊

第8艘!美军空降印度洋,抢15万吨中国香港油轮,针对中俄古委伊

谛听骨语本尊
2026-02-10 12:39:22
湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

芊芊子吟
2026-01-15 10:20:03
为啥你没收到退役军人春节慰问金?3个原因,很多战友不知道!

为啥你没收到退役军人春节慰问金?3个原因,很多战友不知道!

Ck的蜜糖
2026-02-11 06:36:19
重磅!上海大都市圈扩容至“1+13”,2035年建成世界级现代化国际大都市圈

重磅!上海大都市圈扩容至“1+13”,2035年建成世界级现代化国际大都市圈

经济观察报
2026-02-10 19:17:23
小威廉姆斯代言注射减肥药GLP-1引热议,称已暴瘦30斤

小威廉姆斯代言注射减肥药GLP-1引热议,称已暴瘦30斤

懂球帝
2026-02-11 00:25:37
嫡长子的压迫感到底有多大!

嫡长子的压迫感到底有多大!

另子维爱读史
2026-02-06 20:22:00
2026-02-11 07:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16248文章数 514601关注度
往期回顾 全部

科技要闻

Seedance刷屏:网友们玩疯 影视圈瑟瑟发抖

头条要闻

28岁小伙年会醉酒 被同事送回宿舍后心脏骤停死亡

头条要闻

28岁小伙年会醉酒 被同事送回宿舍后心脏骤停死亡

体育要闻

NBA上演全武行,超大冲突4人驱逐!

娱乐要闻

章子怡和马丽争影后 金像奖提名太精彩

财经要闻

雀巢中国近千经销商的“追债记”

汽车要闻

应用于190KW四驱Ultra版 方程豹钛7搭载天神之眼5.0

态度原创

教育
亲子
旅游
本地
公开课

教育要闻

“正常男生不会这样”,家长晒大学儿子,网友:把儿子养成姑娘了

亲子要闻

萌娃和爸爸争夺妈妈,爆笑发言:这是我的妈妈,你的妈妈在奶奶家

旅游要闻

吃鱼好去处 四川泸州纳溪焕新打造的“鲜鱼巷”开街了

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版