网易首页 > 网易号 > 正文 申请入驻

AI离获得诺贝尔奖还有多远?一份免疫学实验报告给出的惊人答案

0
分享至


编辑、整理丨BioArt编辑部

在今天的实验室里,你很可能会看到这样一幅景象:一位研究员一边喝着咖啡,一边和屏幕上的聊天窗口讨论着复杂的科学问题。这位不知疲倦、学识渊博的 “ 同事 ” ,正是像 ChatGPT 这样的大型语言模型LLM)。我们对这些 AI“ 合作者 ” 寄予厚望,期待它们能加速科学发现的进程。

但这引发了一个关键问题:这些 AI 代理在提出真正原创的科学假说方面,真的能与浸淫领域数十载的人类科学家相提并论吗?它们是真正的创意伙伴,还是只是一个超级高效的图书管理员?

近日, Science Immunology 发表一个有趣的研究:

AI immunologists are here: Are they ready for prime time?
为了探究这个问题, Rodriguez 及其同事设计了一场巧妙的实验,名为 “创造力游戏” ( Creation Game ),AI扮演免疫学家来接受挑战。本文将为你揭示这场实验得出的四个最令人惊讶,甚至有些反直觉的发现。


AI 是个出色的实习生,但还不是PI

实验结果首先肯定了 AI 的强大能力。在 “ 创造力游戏 ” 中,像 ChatGPT-4o 这样的顶尖模型在回顾相关文献、生成看似合理的假说,甚至建议验证实验等方面都表现 “ 出色 ” ( admirably )。它能迅速整理信息,提出有理有据的初步想法,就像一个顶尖的博士生。

然而,它的核心局限也暴露无遗。尽管AI能熟练地运用众所周知的知识,但在生成真正意义上的原创材料( original materials ),比如一个前所未有的假说或一种创新的实验程序时,它就显得力不从心了。例如,在分析固醇调节元件结合蛋白( SREBPs )时, AI 可以完美地 “ 反刍 ” 文献中已知的关于 SREBPs 在免疫中的功能,但对于解释疫苗反应中代謝調控的深層 “ 機制性見解 ” ( mechanistic insights ) —— 一個需要真正洞察力的任務 —— 它卻束手無策。

正如研究人员在论文中指出的那样:AI目前能帮你把已有的点连接起来,但还无法发现那些地图上尚未标出的新大陆。

想让 AI 更有创意?提问的方式得 “ 粗线条 ” 一些

我们都知道, LLM 对我们输入提示词( Prompt )的微小变化都极为敏感,有时多一个空格 都可能产生 “ 蝴蝶效应 ” ,导致结果大相径庭。但当目标是激发创造力时,一个反直觉的现象出现了。

这项 研究发现, AI 假说的生成存在一个 “ 新颖性 - 可验证性权衡 ” ( novelty-verifiability trade-off )。令人惊讶的是,触发更高创造力的策略,恰恰是提供更少的信息。

  • “ 零样本 ” 提示( Zero-shot prompts ) :当研究人员不给 AI 任何具体的例子,只是提出一个开放性问题时, AI 反而能产生更具创造力、更大胆的假说。

  • “ 五样本 ” 提示( Five-shot prompts ) :相反,如果给 AI 提供五个相关的上下文示例,它产生的假说虽然更 “ 接地气 ” 、更符合现有文献,但也因此失去了新颖性,创造力大打折扣。

这个发现颠覆了我们的常规认知。我们通常认为,给 AI 提供更丰富的上下文信息会让它表现得更好。然而,在追求科学创新的道路上,有时候少即是多。给AI留出更多想象空间,似乎更能激发它的创造潜能。

评估 AI 创造力的最大障碍,可能就是人类专家自己

这个发现或许最具争议性。 Rodriguez 等人在研究中特别强调了 “ 人类监督 ” ( human oversight )的局限性。当我们请领域内的专家来评估 AI 生成的假说是否 “ 有创意 ” 时,一个悖论出现了:专家的评估标准本身,可能就成了创新的绊脚石。

原因在于,专家的深厚知识和经验建立在现有的科学范式之上。因此,他们在评估时可能会不自觉地偏爱那些符合 “ 传统科学智慧 ” ( conventional scientific wisdom )的想法,而对那些跳出既定框架、看似 “ 离经叛道 ” 的创新想法给予低估或直接忽略。这就像让一位古典音乐大师去评判一场前卫的电子音乐会,他可能会因为不符合传统乐理而给出差评。这凸显了一个迫切的需求:我们需要开发一套一致的、量化的评估指标,来客观衡量 AI 的认知能力和创意的 “ 新颖性 ” 。像 “ 相对邻居密度算法 ” ( Relative Neighbor Density algorithm )这样的工具正在朝这个方向努力,它试图通过算法来识别那些处于知识网络稀疏区域的 “ 创新 ” 想法。

AI 科研的未来不是独行侠,而是 “ 机器人团队会议 ”

如果说单个 AI 的表现还不足以独当一面,那么最有前途的未来方向,似乎是组建一个 AI 团队。这种 “ 多代理 ” ( multiagent )方法,不再是让一个 AI 与人类互动,而是让多个 AI 代理(各自被赋予不同角色)相互协作、辩论,并与人类研究员共同工作。

这就像组建一个虚拟实验室团队。一个名为 “ 虚拟实验室 ” ( The Virtual Lab )的项目就是绝佳例证。在这个项目中,一个 AI 扮演首席研究员( PI ),它根据人类设定的目标,组建了一个由 AI 免疫学家、 AI 计算生物学家和 AI 机器学习专家组成的团队。在整个互动过程中,一个惊人的数据显示:超过 98% 的文字是由 LLM 代理生成的。这个 AI 团队最终设计出了 92 种纳米抗体,其中两种经真实实验证明有效。

另一个名为 “CellForge” 的多代理系统也展示了这种趋势。这些系统证明,通过模拟跨学科的团队合作, AI 能够完成从数据整理到模型构建再到结果分析的复杂科研工作流。当然,目前的局限也很明显:它们的核心任务仍然是 “ 计算性的 ” ( computational in nature ),如何与真实世界的湿实验形成反馈闭环,将是 “ 关键的下一步 ” 。

结论

所以,AI免疫学家准备好迎接黄金时代了吗?答案是:单个的AI或许还没有,但一个由AI专家、AI批评家和人类科学家组成的跨学科“AI团队,正展现出解决复杂科学问题的巨大潜力。它们不再仅仅是知识的提取器,而开始成为知识的创造者。

随着这些 AI 团队与真实世界的实验室数据和实验反馈实现闭环,未来的问题或许不再是它们 能否 做出突破性发现,而是当它们做到时,我们又该如何自处?

https://www.science.org/doi/10.1126/sciimmunol.aea8735

制版人: 十一

学术合作组织

(*排名不分先后)



战略合作伙伴

(*排名不分先后)



转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐


点击主页推荐活动

关注更多最新活动!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
实锤了,美军只是“取快递”,真正卖掉马杜罗的是他们

实锤了,美军只是“取快递”,真正卖掉马杜罗的是他们

嫹笔牂牂
2026-01-04 16:30:13
上海男篮8连胜登顶,王哲林11中10砍21+8 启用11人轮换 全部得分

上海男篮8连胜登顶,王哲林11中10砍21+8 启用11人轮换 全部得分

替补席看球
2026-01-07 21:21:00
《罚罪2》结局:张欣被抓,老麦牺牲,文妈举报刘天也并断绝关系

《罚罪2》结局:张欣被抓,老麦牺牲,文妈举报刘天也并断绝关系

七堇年a
2026-01-07 20:37:26
49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

阿纂看事
2025-12-12 09:18:29
万科创始人王石与田朴珺显著切割

万科创始人王石与田朴珺显著切割

地产微资讯
2026-01-08 08:59:35
短剧演员没法和正剧比 不在一个层次 感觉娜扎眼里嫌恶快要溢出来了

短剧演员没法和正剧比 不在一个层次 感觉娜扎眼里嫌恶快要溢出来了

东方不败然多多
2026-01-06 14:27:48
陪玩陪睡不算什么?男明星共享女友曝光后?两位京圈格格被牵连

陪玩陪睡不算什么?男明星共享女友曝光后?两位京圈格格被牵连

娱说瑜悦
2026-01-06 17:32:59
回顾:重庆一女子2月内用燃气23万,供气公司停掉燃气后,结果如何?

回顾:重庆一女子2月内用燃气23万,供气公司停掉燃气后,结果如何?

清澈之玹
2024-12-13 10:23:28
CCTV直播!国乒1月8日赛程:向鹏硬扛张本智和,王曼昱战大藤沙月

CCTV直播!国乒1月8日赛程:向鹏硬扛张本智和,王曼昱战大藤沙月

好乒乓
2026-01-08 01:17:30
憋屈30年,中国终于掀桌子!一纸退货令甩出,澳洲巨头彻底慌神

憋屈30年,中国终于掀桌子!一纸退货令甩出,澳洲巨头彻底慌神

近史博览
2025-12-31 17:04:43
司晓迪事件升级:服40片安眠药,老板曝更多聊天记录

司晓迪事件升级:服40片安眠药,老板曝更多聊天记录

准备好了吗
2026-01-08 09:03:41
卢比奥一语道破委内瑞拉荒诞真相:马杜罗的江山,古巴人的管家

卢比奥一语道破委内瑞拉荒诞真相:马杜罗的江山,古巴人的管家

老马拉车莫少装
2026-01-05 21:46:08
陈洁如临终前的一封信,让蒋介石泪流满面,蒋介石坦言未曾忘记她

陈洁如临终前的一封信,让蒋介石泪流满面,蒋介石坦言未曾忘记她

历史甄有趣
2026-01-08 08:55:08
陈坤的儿子已成年,容貌开始显现母亲的基因,像谁可以认出来吗?

陈坤的儿子已成年,容貌开始显现母亲的基因,像谁可以认出来吗?

查尔菲的笔记
2026-01-07 13:12:27
结束访华前,李在明称韩中关系“互不可缺”

结束访华前,李在明称韩中关系“互不可缺”

环球网资讯
2026-01-08 06:50:09
破案了!麦考尔和史密斯赛后突然吵架的原因找到,媒体人说出实情

破案了!麦考尔和史密斯赛后突然吵架的原因找到,媒体人说出实情

后仰大风车
2026-01-08 07:35:05
宇宙真的有轮回吗?庞加莱回归证明,一切都会重演无数次

宇宙真的有轮回吗?庞加莱回归证明,一切都会重演无数次

观察宇宙
2026-01-07 21:32:45
iPhone 官方半价换电池,钉子户终于等到了!

iPhone 官方半价换电池,钉子户终于等到了!

黑猫科技迷
2026-01-07 23:57:35
外媒狂欢,美军速通委内瑞拉,是因为中国反隐身雷达性能不行?

外媒狂欢,美军速通委内瑞拉,是因为中国反隐身雷达性能不行?

笑谈历史阿晡
2026-01-08 08:19:23
西班牙签订直升机采购大单

西班牙签订直升机采购大单

海外网
2026-01-07 09:47:02
2026-01-08 10:28:49
BioArt incentive-icons
BioArt
探索生物艺术之奥秘
8862文章数 18483关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

牛弹琴:美国又干了件石破天惊的事 俄罗斯遭沉重打击

头条要闻

牛弹琴:美国又干了件石破天惊的事 俄罗斯遭沉重打击

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

《马背摇篮》首播,革命的乐观主义故事

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

游戏
手机
本地
艺术
公开课

《GTA6》内容可能尚未完成 能否按期发售尚无定论

手机要闻

小米:强烈推荐老款SU7排单用户升级新一代SU7!会优先排产

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

艺术要闻

你不知道的“山麻纸”:书写中竟藏着七重门的秘密!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版