网易首页 > 网易号 > 正文 申请入驻

谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证

0
分享至

新智元报道

编辑:LRS

【新智元导读】AI co-scientist系统基于Gemini 2.0开发,能够协助科研人员生成新的研究假设、制定实验方案,并通过自我改进提升结果质量。在生物医学应用中,AI co-scientist成功预测了药物再利用方向、提出新的治疗靶点,并解释了抗菌耐药机制。

在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行idea验证。

科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。

最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。

论文链接:https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf

AI co-scientist系统的输入为一段用自然语言描述的研究目标,输出为全新的研究假设、详细的研究概述和实验方案。

根据科研活动本身的特性,开发者设计了多个专用智能体用来「生成、反思、排名、进化、邻近性检查、元审查(meta review)」,使用自动反馈信号来迭代生成、评估和改进假设,构成了一个自我修正、改进的循环机制,逐步生成质量更高、创新性更好的假设。

系统的核心思路就是「协助科研」,所以开发者设计了多种方式让研究人员与系统进行互动,比如「直接提供种子想法」进行探索或是对生成的结果提供「自然语言反馈」。

系统还用到了外部工具,如网络搜索和专用AI模型,以增强生成假设的依据和质量。

AI co-scientist将分配的目标解析为研究计划配置,由监督智能体(supervisor agent)负责将专用智能体分配到工作队列并分配资源,使得系统能够灵活扩展计算能力,并迭代地提高其科学推理能力,以实现指定的研究目标。

测试时计算(test-time compute)

AI co-scientist使用「测试时计算」技术来迭代推理、进化和改进输出,如进行自我对弈(self-play)科学辩论以生成新假设,对所有假设进行质量排名对比,或是不断进化假设等,可以让智能体不断进行自我批评,使用工具进行反馈以细化假设和提案。

论文链接:https://arxiv.org/abs/2408.03314

系统的自我提升能力主要依赖于Elo自动评估指标,通过对模型的输出进行对比竞赛,最终可以得到一个Elo值,研究人员分析了Elo自动评级与GPQA中diamond set(有难度的问题集合)准确率的匹配度,结果发现Elo评级与输出质量呈正相关。

AI co-scientist(蓝色线)和Gemini 2.0(红色线)的平均准确率对比,按Elo评级分组

七位领域专家在其专业领域内精心挑选了15个开放研究目标和最佳解决方案,使用自动化的Elo指标,结果发现AI co-scientist在复杂问题上的表现优于其他最先进的智能体和推理模型。

随着系统在推理和改进上花费更多时间,结果的自我评估质量提高,并超越了模型和无助的人类专家。

结果也验证了「使用从科学方法中归纳出的先验知识」进行「测试时计算」扩展的优势:系统在推理和改进上花费的时间越多,结果的自我评估质量越高,最终超越了其他模型和人类专家。

AI co-scientist的性能会随着系统在计算上花费时间更多而逐步提高

在11个研究目标的小子集上,专家们评估了AI co-scientist生成结果相对于其他基线模型在新颖性(novelty)和影响潜力(impact)的总体偏好,虽然样本量较小,但专家们普遍认为AI co-scientist更受欢迎,与之前引入的Elo自动评估指标一致。

真实场景应用

药物再利用治疗急性髓系白血病

药物研发是一个耗时且昂贵的流程,新的治疗方法需要重新启动发现和开发流程,以治疗不同的适应症或疾病。

药物再利用(drug repurposing)通过发现现有药物超出其原始预期用途的新治疗应用来克服该难题,但由于任务复杂,需要广泛的跨学科专业知识。

研究人员使用AI co-scientist来辅助预测潜在的药物再利用研究方向,模型提出了针对急性髓系白血病(AML)全新的、可再利用的候选药物,随后与合作团队通过计算生物学、专家临床医生反馈和体外实验验证了模型的预测结果,证实该药物在多个AML细胞系中,在临床相关浓度下能够抑制肿瘤活力。

三种新型AI合科学家预测的 AML 再利用药物之一的有效剂量反应曲线;KIRA6在临床相关浓度下抑制KG-1(AML细胞系)的存活,能够在较低药物浓度下降低癌细胞存活,减少了脱靶副作用的可能性

推进肝纤维化目标发现

识别新型治疗靶点比药物再利用更复杂,通常会导致假设选择效率低下、体外及体内实验优先级排序不当。人工智能辅助靶点发现有助于简化实验验证过程,降低开发时间成本。

AI co-scientist通过识别基于临床前证据并具有显著抗纤维化活性的表观遗传学靶点(3D、多细胞组织培养,由人类细胞衍生并设计来模拟人类肝脏的结构和功能),展现了其在提出、排序和生成针对发现假设的假设和实验方案方面的潜力,相关报告即将与合作者斯坦福大学共同发布。

AI co-scientist建议的治疗方案与纤维化诱导剂(阴性对照)和抑制剂(阳性对照)的治疗效果对比

解释抗菌药物耐药机制

研究人员指示AI co-scientist探索小组内已经进行过新颖发现但尚未公开的课题,解释囊膜形成噬菌体诱导的染色体岛(cf-PICIs)如何在多种细菌物种中存在?

「微生物进化出的抵抗感染治疗药物的机制」涉及到理解基因转移(接合、转导和转化)的分子机制,以及推动抗菌药物耐药性(AMR)基因传播的生态和进化压力。

AI co-scientist系统独立提出,cf-PICIs 与多种噬菌体尾部相互作用以扩大宿主范围,在之前进行的实验中得到了验证,进一步说明AI co-scientist作为辅助技术的价值,能够利用数十年前的研究结果。

AI co-scientist重新发现新型基因转移机制的时间线。蓝色:cf-PICI发现实验研究流程时间线。红色:AI co-scientist在没有先验知识的情况下发展和重现这些关键发现

参考资料:

https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关闭全部门店,盒马创始人又失败了

关闭全部门店,盒马创始人又失败了

邱处机
2025-11-17 19:06:09
大学生投身业界——Casey Calvert

大学生投身业界——Casey Calvert

吃瓜党二号头目
2025-11-18 10:26:21
国防部:已向美方提出严正交涉!

国防部:已向美方提出严正交涉!

新京报
2025-11-17 21:45:58
普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

博览历史
2025-10-27 08:20:12
热议快船近9战8负!名记怒斥球队已是烂摊子 美媒调侃为雷霆争夺状元签

热议快船近9战8负!名记怒斥球队已是烂摊子 美媒调侃为雷霆争夺状元签

烟浔渺渺
2025-11-18 14:39:37
王长庆回应“摘桃”:启蒙不是我带的就算摘桃?我们考察了200多人

王长庆回应“摘桃”:启蒙不是我带的就算摘桃?我们考察了200多人

懂球帝
2025-11-18 09:29:18
全运会最新金牌榜!山东40金,浙江单日狂揽10金反超江苏逼近广东

全运会最新金牌榜!山东40金,浙江单日狂揽10金反超江苏逼近广东

老吴说体育
2025-11-18 00:56:22
落袋为安!90岁老人套现10个亿跑了,能卖的全卖,不能卖的全质押

落袋为安!90岁老人套现10个亿跑了,能卖的全卖,不能卖的全质押

来科点谱
2025-11-17 09:05:36
柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

军机Talk
2025-11-18 10:32:40
《四喜》剧情再次反转!沈明珠顺利拿回房产,是大倪在背后帮了忙

《四喜》剧情再次反转!沈明珠顺利拿回房产,是大倪在背后帮了忙

妙知
2025-11-18 12:23:24
秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

墨兰史书
2025-11-18 02:30:03
俄乌战场告急,泽连斯基与希腊签完大单后赶赴法国拿下100架“阵风”战斗机

俄乌战场告急,泽连斯基与希腊签完大单后赶赴法国拿下100架“阵风”战斗机

上观新闻
2025-11-17 22:08:07
憋屈的国宝:用七千斤名玉打造,被当腌菜缸,装了300年咸菜

憋屈的国宝:用七千斤名玉打造,被当腌菜缸,装了300年咸菜

鹤羽说个事
2025-11-13 10:49:43
吴建豪谈F4:真正让我们分道扬镳的,不是泄密,是嫉妒

吴建豪谈F4:真正让我们分道扬镳的,不是泄密,是嫉妒

不八卦掌门人
2025-11-15 16:53:06
剑桥学霸诞生!谢氏家族迎来高光时刻,三代逆袭:从戏子到科学家

剑桥学霸诞生!谢氏家族迎来高光时刻,三代逆袭:从戏子到科学家

荆楚寰宇文枢
2025-11-16 21:12:28
猛龙过去9场8胜,升至东部第三!莺歌27分6板,黄蜂3人空砍20+

猛龙过去9场8胜,升至东部第三!莺歌27分6板,黄蜂3人空砍20+

无术不学
2025-11-18 12:22:06
苏提达枣红造型雍容华贵,尽显王室风范

苏提达枣红造型雍容华贵,尽显王室风范

述家娱记
2025-11-18 10:33:27
现在找工作已经不是工资的问题了。

现在找工作已经不是工资的问题了。

爱吃糖的猫cat
2025-11-17 20:37:54
从10秒08到9秒83:李泽洋破纪录的“细节密码”与概率推演

从10秒08到9秒83:李泽洋破纪录的“细节密码”与概率推演

KD说球
2025-11-18 14:47:46
刚果金一架飞机坠毁起火:载有矿业部长,视察49死矿难现场后乘机返航

刚果金一架飞机坠毁起火:载有矿业部长,视察49死矿难现场后乘机返航

极目新闻
2025-11-18 10:55:02
2025-11-18 16:07:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13895文章数 66259关注度
往期回顾 全部

科技要闻

OPPO Reno15系列深评:实况封神+颜值暴击

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

手机
数码
教育
时尚
家居

手机要闻

华为Mate80系列/ Mate X7即将发布:鸿蒙版微信等App趋于完善

数码要闻

Noctua预热黑化新品,预计为chromax.black版NH-D15 G2风冷

教育要闻

老师分享:孩子初中、小学成绩具有欺骗性

大风降温,就穿羊羔毛!

家居要闻

彰显奢华 意式经典风格

无障碍浏览 进入关怀版