人工智能代写了一位哈佛物理学家最新的论文。没人知道这对科学意味着什么。
随着大型语言模型(LLM)计算技能的进步,理论科学领域正在考虑自身可能被取代的可能性。或许他们也乐于被取代?
玛丽亚·博雷尔·费雷罗和阿舍尔·J·蒙哥马利
![]()
四月中旬的一个星期四下午,近 400 名物理学家和物理系学生挤满了哈佛科学中心的一个阶梯教室,了解他们的继任者是谁。
哈佛大学物理学教授马修·D·施瓦茨长期以来一直是智能人工智能的倡导者,智能人工智能能够自主行动、推理,并在理论物理学领域开展研究生水平的研究。
“我想说,10年后,我们就会退出这个领域。我的意思是,到时候我们将从事一些我们无法理解的事情。而我们所做的其中一部分工作就是翻译和撰写科普书籍,”施瓦茨对听众说道。
这一宣布并没有让在场的多少人感到意外——施瓦茨多年来一直预言人类物理学研究的终结。但现在,所有人都开始关注他了。
今年一月,施瓦茨发表了一篇题为“利用有效场论对C参数苏达科夫肩进行重求和”的论文。摘要的最后一行写道:“所有计算、数值分析和论文撰写均由Anthropic公司开发的AI助手Claude在物理学家的指导下完成。”
施瓦茨在3月份发表于Anthropic网站的一篇博文中描述了这一过程。他仅用文字提示指导这个大模型,就在两周内完成了他所说的如果由一位普通研究生指导则需要两年才能完成的工作。
施瓦茨称论文本身的内容“并不十分令人兴奋”,而且“只有二年级研究生的水平”,但在他看来,这篇论文展现出的能力有可能彻底改变一个受人类思维限制的领域。
“人类的能力是有限的,”他说。“我们只关注我们能够理解的事物,但这并不一定能帮助我们理解宇宙。”
但并非所有人都对人工智能的科学能力深信不疑。
纽约大学天体物理学家大卫·W·霍格表示,物理学(他称之为“人类对物理世界的理解”)需要比人工智能目前所能达到的更多的创造力和独创性。
“大家都兴奋得不得了,好像世界末日来临了似的。其实,网络搜索只是稍微改进了一下而已。然后大家就都觉得,‘哦,我们创造了一个有意识、有智慧的生命体,’”霍格说道,接着又补充道,“它实际上什么都没做。只是,大家都觉得它会做点什么。”
“这需要大量的人工监督”
人工智能在理论科学中的应用范围很广,从简单的计算和编码(这些已经融入到工作流程中)到依赖大型语言模型作为类似合作者的工具。
哈佛大学物理系研究生亚历山大·米歇尔表示,虽然他使用 OpenAI 的 Codex 环境进行一些编码和其他可以快速、准确地验证输出的任务,但他的团队对理论物理问题的计算大部分仍然是手工完成的。
“如果你有能力快速生成可验证的内容,那么这将极大地提高生产力,”他说。“如果你指的是用它来生成更难验证的内容,我会说目前它的产量有所提高,但对于很多这类任务来说,验证成本仍然很高。”
然而,有些人已经将大型语言模型(LLM)的应用拓展到了编码和计算之外。奥斯卡·巴雷拉是施瓦茨高能理论研究小组的一名二年级物理学研究生,他收到了施瓦茨赠送的Claude订阅。现在,他用它来总结论文中的背景信息,并测试解决研究问题的不同方法。巴雷拉说,在人工智能出现之前,他经常需要花费时间学习一些以后再也不会用到的知识,才能理解论文中的步骤。
现在,他利用 Claude 将自己当前的理解水平与正在阅读的论文联系起来。由于人工智能会生成注释来填补他理解上的空白,他只需通读一遍就能理解一篇复杂的论文。
数学教授 Lauren K. Williams '00 也利用人工智能的侦察能力,例如检查她想在证明中使用的语句是否已被发现。
她表示,如果由经验丰富的人来操作,这种方法可以大大加快学习速度。但收益并非总是净收益。她最近让大模型总结她正在学习的一个主题,总结的内容看起来不错——直到她开始仔细审查为止。
“我最终花了很多时间检查它是否真的引用了存在的论文和定理,”她说。
威廉姆斯称验证过程很无趣,并解释说,如果从一开始就由她自己来完成这项工作,那将会更“有趣”和“有意义”。
她对LLM的其他能力也很感兴趣。通过“首个证明项目”,她正与一个数学家团队合作,评估人工智能目前的研究级推理能力。今年二月,他们要求几个商业人工智能模型证明10个命题,这些命题均来自他们自己尚未发表的、涵盖多个数学领域的研究。在没有额外提示的情况下,LLM成功解决了其中两个命题。
物理学教授席尹发现,人工智能不仅仅是一个高效的工具——它让他能够完成如果没有人工智能的计算能力,他甚至都不会考虑承担的工作。
“这需要大量的人工监督,”尹说。“但对我来说,速度仍然提高了至少100倍,几周就能写出我以前需要10年才能写完的代码。”
但对于纽约大学天体物理学家霍格来说,真正有意义的研究需要比他所看到的大模型所做的——从现有文本中重复利用文本——更具创造力。
他说:“我们做研究的时候,总是会进入一些无人知晓的领域。所以,我们不仅仅是在计算一些东西,而是在做一些前所未有的事情。我们不知道接下来会发生什么。”
然而,尹并不认为这是一种限制。“这实际上是一个计算问题,”他指出,LLM 训练所依赖的数据量“极其庞大”,这是人类无法凭直觉理解的。“我个人认为,没有任何一种人类的智力能力是人工智能无法复制的,”他说。
“现在是当科学怪人的最佳时机”
人工智能能力的快速发展引发了人们对科学出版的未来以及为确保已发表论文的有效性而应制定的规范的疑问。
如今,已完成的物理研究通常以论文的形式发表在存档网站上,详细介绍研究过程,论文会一直保留在那里,直到由主要由志愿者组成的专家进行同行评审,然后发表在期刊上。
担任多家期刊编辑的威廉姆斯表示,随着人工智能加快研究产出,目前积压的未经审阅和未发表的论文数量将继续增长。
“突然之间,所有这些做志愿者工作的人的工作量都增加了三倍甚至十倍。这真是个问题,”她说。
施瓦茨表示,研究人员必须继续对其发表的论文承担全部责任,并对人工智能的使用保持完全透明,但要防止人工智能的粗制滥造,就需要学术界克服“发表论文的压力”。
“你想写一篇五年后人们还会记得的论文。这比写500篇没人记得的论文重要得多,”他说。
2019 届天体物理学博士后研究员 Rodrigo Córdova Rosado 认为,困难之处还在于 LLM 看起来多么可靠,即使它们是错误的。
他说:“人们放松警惕的门槛已经大大降低了。这些工具让人觉得它们解决了问题,但实际上它们很可能并没有,甚至可能把你引向歧途。要负责任地使用这些工具,需要大量的智慧和经验,而这些智慧和经验只能通过反复试验才能获得。”
2011 年毕业于范德比尔特大学的物理学教授 Alex Lupsasca 现在就职于 OpenAI,他认为这不是人工智能本身的问题,而是研究人员在使用人工智能时如何履行个人责任的问题。
他认为提供LLM的公司负有一定责任,但他将这种情况比作开车冲下悬崖——“除非汽车有缺陷,否则这在某种程度上是你的错;你只是没有正确使用汽车,”他说。
卢普斯卡表示,人工智能有可能加剧虚假信息的传播,但虚假信息的存在并不是一个新问题。
“理论物理学领域一直不乏异想天开的怪人。的确,现在正是当个怪人的最佳时机,就像现在正是当个严肃研究人员的最佳时机一样,”他说。
一些研究人员甚至认为,科学出版方式将会发生而且应该发生根本性的变革。自17世纪以来,科学家们一直在科学期刊上发表论文,如今随着互联网的兴起,这些期刊也实现了数字化。一些人希望并期待这一过程能够改变。
“早在人工智能出现之前,我就觉得发表论文并不是组织科学知识的有效方式,”尹说。“当我浏览论文库时,感觉它就像一个街头市场,而不是一座宏伟的建筑。我认为在人工智能时代,或许会有更好的架构。”
然而,尹并没有提出替代方案。
斯坦福大学物理学教授齐晓亮在人工智能智能体演讲的同一天发表了一篇新论文,概述了一种可以取代传统论文形式的设想。齐教授提出用人工智能智能体来替代传统论文。他写道,这些交互式智能体“能够解释研究背景、所用方法、推理过程、中间决策以及相关的工具接口”。
我们为什么要从事天体物理学?
关于理论的根本目的以及大学如何实践理论的分歧,加剧了人们对人工智能时代科学应该如何变革的不同看法。
霍格表示,虽然他不介意使用人工智能来编写代码,但他重视学习和协作中的人际互动,而大语言模型(LLM)无法提供这种互动,因为它“无法从你与他们的互动中学习”。
“我们为什么要从事天体物理学?我认为主要是为了帮助人们,培养人才,教人们学习知识,并将知识传播给更多的人,”他说道。“很多人认为,如果某个机构发表论文的速度比其他机构快,那么它就是更优秀的科学家。但我认为这是对科学本质的误解。”
卢普萨斯卡认为,物理学的意义在于试图理解我们在宇宙中的位置以及世界的运行方式,所以“你如何弄明白它其实并不重要,”他说。
“关键在于找到解决办法,”他补充道。“任何工具都可以用。”
尹表示同意,他说:“如果人工智能能够找到答案并有办法验证答案,我会非常高兴。”
“解决方案是否是我自己提出的并不重要。”他补充说,考虑到他认为人工智能现在“已经达到了合格研究生的水平”,这也不是不可能。
但霍格表示,他的同事们将人工智能的能力与研究生的能力相提并论,首先就误解了研究生教育的目的。
“我确信有一点是错误的,那就是人们会说,‘哦,和克劳德交流比和研究生交流更有用、效率更高,’”他说。“我对此深表反对,要考虑的是效率更高对谁更有利?效率更高体现在哪些方面?”
霍格斯并不把他的研究生视为下属,而是科学知识的继承者。“我希望他们学习新知识,我希望他们成长,我希望他们掌握新技能,我希望他们了解宇宙。”
另一方面,施瓦茨认为人工智能对于物理学的下一个重大发现至关重要,也是加速学习的一种方式。
“它的主要作用就是帮助每个人更快地学习,”施瓦茨说。“我们都会变得非常聪明。”
罗德里戈表示,人工智能能够解放研究人员的时间,让他们专注于创造性思维,这虽然是一个“充满乐观”的世界,令人“惊叹”,但他担心人工智能会让人轻易地超越学习所必需的努力。
他说:“我希望我们所有人都能认真思考,用这些工具进行科学研究意味着什么,以及我们如何以负责任的方式使用这些工具,从而促进更好的科学发展,而不是削弱我们进行科学研究的能力。”
除了人工智能给教育带来的挑战之外,霍格表示,在想象中的未来,人类只是翻译大模型的研究成果,而不是自己进行研究,“物理学将会消亡”。
“为什么要学物理?你根本不需要学物理,”霍格斯说。“你完全可以在下班开车回家的路上听人工智能生成的播客,里面就讲得很清楚了。”
— 杂志撰稿人 Maria Borrell Ferrero 的联系方式为maria.borrellferrero@thecrimson.com。
— 可通过asher.montgomery@thecrimson.com联系特约撰稿人 Asher J. Montgomery 。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.