网易首页 > 网易号 > 正文 申请入驻

「AI Scientist」会给科学带来什么?AI for Science 热潮下的争议

0
分享至

来源:ScienceAI

编译:KX

8 月份,Transformer 作者创业公司 Sakana AI 宣布推出 ,声称「首个用于自动化科学研究和开放式发现的 AI 系统!」

当 Sakana AI 着手创建「AI Scientist」来处理整个科学过程时,他们并不知道他们能走多远。他们创建的系统真的能够生成有趣的假设、运行实验、评估结果并撰写论文吗?

参与「AI Scientist」研究的不列颠哥伦比亚大学的博士后研究员 Cong Lu 说,他们最终得到的是一个 AI 工具,并认为它相当于一个早期的博士生。

他说,它有一些「令人惊讶的创意」,但好的创意远远少于坏的创意。它很难连贯地写出结果,有时还会误解结果:「这与博士生对某件事起作用的原因进行大胆猜测相差无几,」Lu 说。而且,也许就像一个还不懂伦理的早期博士生一样,尽管研究人员尽了最大努力保持诚实,但它有时会在论文中编造一些东西。

最近发布在 ArXiv 的预印本,虽然讨论了局限性和道德伦理,但也 包含了一些相当夸张的语言,称 AI Scientist 是「科学发现新时代的开始」,以及 「第一个全自动科学发现的综合框架,使前沿大型语言模型 (LLM) 能够独立进行研究并交流他们的发现。」

AI Scientist 似乎抓住了时代精神。它正乘着 AI 用于科学的热情浪潮,但一些批评人士认为,这股浪潮不会把任何有价值的东西扔到沙滩上。

「AI for Science」的热潮

AI Scientist 是 AI for Science 大势所趋的一部分。谷歌 DeepMind 早在 2020 年就掀起了这股热潮,当时它推出的 AI 系统 AlphaFold,以前所未有的精度预测蛋白质的 3D 结构,令生物学家惊叹不已。

自生成式 AI 出现以来,越来越多的大公司参与其中。索尼 AI 高级研究员 Tarek Besold 负责该公司的 AI 用于科学发现项目,他说,AI for science 是「AI 社区可以团结起来,努力推进底层技术的目标,但更重要的是,它还可以帮助人类解决我们这个时代最紧迫的一些问题。」

A-Lab

然而,这场「运动」也有批评者。2023 年,谷歌 DeepMind 发表论文,声称发现了 220 万种新晶体结构,相当于近 800 年的知识,不久之后,两位材料科学家对所提结构进行了随机抽样分析,并表示他们发现「同时满足新颖性、可信度和实用性的化合物证据不足」。换句话说,AI 可以快速生成大量结果,但这些结果实际上可能没有用。

AI Scientist 的工作方式

在 AI Scientist 的案例中,研究人员仅在计算机科学上测试了他们的系统,要求它研究与大型语言模型相关的主题,这些模型为 ChatGPT 等聊天机器人、扩散模型以及 AI Scientist 本身提供支持。

AI Scientist 的第一步是假设生成。给定正在研究的模型的代码,它可以自由地为可以运行以提高模型性能的实验产生想法,并根据有趣性、新颖性和可行性对每个想法进行评分。它可以在此步骤进行迭代,对得分最高的想法产生变体。然后它在 Semantic Scholar 中运行检查,以查看其提案是否与现有工作过于相似。

接下来,它使用名为 Aider 的编码助手来运行其代码,并以实验日志的形式记录结果。它可以使用这些结果来为后续实验产生想法。

AI Scientist

下一步是让 AI Scientist 使用基于会议指南的模板将其结果写成一篇论文。但是,Lu 说,该系统很难写出一篇连贯的九页论文来解释其结果——「写作阶段可能和实验阶段一样难以做好,」他说。因此,研究人员将这个过程分解成许多步骤:AI Scientist 一次写一个部分,并将每个部分与其他部分进行比较,以剔除重复和矛盾的信息。它还会再次通过 Semantic Scholar 查找引用并建立参考书目。

但接下来还有幻觉问题。Lu 说,尽管他们指示 AI Scientist 只使用实验日志中的数字,「但有时它还是会不听话。」Lu 说,模型不听话的概率不到 10%,但「我们认为 10% 可能接受不了。」他说他们正在研究一种解决方案,比如指示系统将论文中的每个数字链接到它在实验日志中出现的位置。但该系统也犯了不太明显的推理和理解错误,这似乎更难修复。

你可能没有想到的是,AI Scientist 甚至包含一个同行评审模块来评估它所写的论文。「我们一直都知道我们想要某种自动化的 [评估],这样我们就不必花几个小时仔细阅读所有的手稿了,」Lu 说。虽然他指出「我们总是担心自己在给自己的作业打分」,但他表示,他们的评估员模仿了领先的 AI 会议 NeurIPS 的评审员指南,发现它总体上比人类评估员更严格。从理论上讲,同行评审功能可用于指导下一轮实验。

对 AI Scientist 的批评

虽然研究人员将他们的 AI Scientist 限制在机器学习实验中,但 Lu 表示,该团队与其他领域的科学家进行了一些有趣的对话。他说,从理论上讲,AI Scientist 可以在任何可以进行模拟实验的领域提供帮助。「一些生物学家表示,他们可以在计算机模拟中做很多事情,」他还提到量子计算和材料科学领域。

一些批评 AI for science 研究的人可能会对这种普遍的乐观情绪提出质疑。今年早些时候,加州大学伯克利分校计算生物学教授 Jennifer Listgarten 在《Nature Biotechnology》上发表了一篇论文,认为 AI 不会在多个科学领域取得突破。她写道,与自然语言处理和计算机视觉等 AI 领域不同,大多数科学领域没有训练模型所需的大量公开数据。

论文链接:https://www.nature.com/articles/s41587-023-02103-0

另外两位研究科学实践的研究人员,耶鲁大学的人类学家 Lisa Messeri 和普林斯顿大学的心理学家 M.J. Crockett,今年在《Nature》杂志上发表的一篇论文,试图打破围绕 AI for science 的炒作。

当被问及对 AI Scientist 的评论时,两人重申了他们对将「AI 产品视为自主研究人员」的担忧。他们认为,这样做可能会将研究范围缩小到适合 AI 的问题,并失去推动真正创新的多元化视角。「虽然 AI Scientist 承诺的生产力对某些人来说可能听起来很有吸引力,但发表论文和产生知识并不相同,忘记这一区别可能会导致我们产出更多,而理解更少。」

但其他人认为 AI Scientist 是朝着正确方向迈出的一步。索尼 AI 的 Besold 说,他认为这是一个很好的例子,说明当今的 AI 在应用于正确的领域和任务时如何支持科学研究。他说:「这可能成为少数几个早期原型之一,可以帮助人们概念化当 AI 应用于科学发现领域时会发生什么。」

AI Scientist 的下一步计划

Lu 表示,该团队计划继续开发 AI Scientist,他表示,在他们寻求提高其性能的过程中,有很多唾手可得的成果。至于这些 AI 工具最终是否会在科学过程中发挥重要作用,Lu 说:「我认为时间会证明这些模型有什么用。」他说,在研究项目的早期阶段,当研究者试图了解许多可能的研究方向时,这些工具可能是有用的,尽管批评者补充说,我们必须等待未来的研究,才能知道这些工具是否真的足够全面和公正,能够有所帮助。

或者,Lu 说,如果这些模型可以改进到与「一名扎实的三年级博士生」的表现相匹配的程度,到那时,任何人都可以成为教授并开展研究计划,Lu 说。「这是我期待的令人兴奋的前景。」

参考内容:

https://spectrum.ieee.org/ai-for-science-2

未来知识库是“ 欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中超14轮积分榜:三、四名互换,西海岸第6,京沪3队濒临降级区

中超14轮积分榜:三、四名互换,西海岸第6,京沪3队濒临降级区

中超伪球迷
2026-05-24 22:37:00
普京失望而返,谈了二十年都没戏,中国这次要俄认清一个事实

普京失望而返,谈了二十年都没戏,中国这次要俄认清一个事实

阿库财经
2026-05-24 23:24:15
公交集团正式员工已经躺平不了了,想要混到退休不太可能

公交集团正式员工已经躺平不了了,想要混到退休不太可能

娱乐圈见解说
2026-05-09 00:23:44
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
补强后防线!大牌后卫有望夏窗驰援国安,球队改打防反为保级而战

补强后防线!大牌后卫有望夏窗驰援国安,球队改打防反为保级而战

体坛鉴春秋
2026-05-25 09:42:16
太离谱了!江苏女子在公园散步,发现走的石板是由一块块墓碑铺的

太离谱了!江苏女子在公园散步,发现走的石板是由一块块墓碑铺的

川渝视觉
2026-05-24 19:56:10
晚年徐向前写回忆录,为何评价张闻天:若是早听毛主席的话就好?

晚年徐向前写回忆录,为何评价张闻天:若是早听毛主席的话就好?

元哥说历史
2026-05-25 10:55:03
一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

心理观察局
2026-05-24 06:57:19
杨瀚森又练出8块腹肌!美媒却建议为补强弃他:模拟4换1墨菲方案

杨瀚森又练出8块腹肌!美媒却建议为补强弃他:模拟4换1墨菲方案

颜小白的篮球梦
2026-05-24 17:46:26
看到我辞职书和8元奖金,妻子怒斥助理:我说过,别招惹我丈夫!

看到我辞职书和8元奖金,妻子怒斥助理:我说过,别招惹我丈夫!

麦子情感故事
2026-05-24 19:52:14
塞尔维亚或迎巨变,数万民众涌上首都街头,武契奇十年统治恐终结

塞尔维亚或迎巨变,数万民众涌上首都街头,武契奇十年统治恐终结

近史博览
2026-05-25 01:28:35
成都⇌四姑娘山2小时直达!“雪山旅列”最新进展

成都⇌四姑娘山2小时直达!“雪山旅列”最新进展

天府发布
2026-05-25 08:10:32
华为发表半导体演进新定律

华为发表半导体演进新定律

第一财经资讯
2026-05-25 09:50:00
杨梅烂了,矿井炸了,不能放过他们!

杨梅烂了,矿井炸了,不能放过他们!

行者殷涛
2026-05-24 10:15:39
血亏 7300 万!曼联堵死最大水货离队路!卡里克宁可烂在手里!

血亏 7300 万!曼联堵死最大水货离队路!卡里克宁可烂在手里!

奶盖熊本熊
2026-05-25 02:06:15
2025-2026赛季CBA联赛总决赛对阵及日程安排确定

2025-2026赛季CBA联赛总决赛对阵及日程安排确定

新京报
2026-05-24 16:36:29
“死了么”改名“在么在么”

“死了么”改名“在么在么”

三言科技
2026-05-24 20:25:04
乌克兰捅了大篓子,袭击俄罗斯学校死伤惨重,中方果断挺身而出

乌克兰捅了大篓子,袭击俄罗斯学校死伤惨重,中方果断挺身而出

阿器谈史
2026-05-24 07:09:56
曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

掠影后有感
2026-05-11 11:31:38
任伟:儿子王楚钦的孝心让我落泪,但未来儿媳要符合这3个要求

任伟:儿子王楚钦的孝心让我落泪,但未来儿媳要符合这3个要求

做一个合格的吃瓜群众
2026-05-25 11:16:42
2026-05-25 12:00:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4762文章数 37465关注度
往期回顾 全部

科技要闻

华为发表半导体演进新定律

头条要闻

约2万公里收费高速公路将到期 到期后会否免费受关注

头条要闻

约2万公里收费高速公路将到期 到期后会否免费受关注

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

洪涛回应歌手淘汰庾澄庆:难以理喻

财经要闻

退市!33年“A股不死鸟”落幕

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

旅游
手机
家居
时尚
公开课

旅游要闻

孝义:曹溪河康养月季园 河谷花海享山野闲适

手机要闻

华为nova 16系列官宣定档,全新配色公布

家居要闻

生与命相依 旧公寓改造

伊姐周日热推:电视剧《盛唐奇案》;电视剧《我的王室死对头》......

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版