网易首页 > 网易号 > 正文 申请入驻

谷歌发布最强「科研辅助神器」能帮你提新 idea,三大真实场景实证

0
分享至

来源:Science AI

在追求科学进步的过程中,研究人员往往需要将创造力和创新精神与基于文献的洞察力和专业知识相结合,以生成新颖且可行的研究方向,并指导后续探索。在许多领域,这带来了广度和深度的难题,因为要在科学出版物数量快速增长的同时,整合来自不熟悉领域的见解是具有挑战性的。但克服这些挑战至关重要,科研突破往往源于跨学科的努力。

如果把这项任务交给 AI 呢?

今天,谷歌宣布推出多智能体 AI 系统 ——AI 科研助手(AI co-scientist),旨在作为科学家的协作工具。AI co-scientist 基于 Gemini 2.0 构建,旨在模拟科学方法背后的推理过程。与标准的文献综述、总结和「深度研究」工具不同,AI co-scientist 系统旨在发现新的、原创的知识,并根据先前的证据和特定的研究目标,制定出明显新颖的研究假设和提案。

AI co-scientist 加速科学发现

AI co-scientist 旨在根据科学家以自然语言描述的研究目标生成新颖的研究假设、详细的研究概述和实验方案。为此,它使用了一组受科学方法启发的专门智能体,分别用于生成、反思、排序、进化、邻近性(Proximity)和元评审。这些智能体通过自动化反馈迭代生成、评估和完善假设,从而形成一个自我改进的循环,产生越来越高质量和新颖的输出。

AI co-scientist 专为协作而设计,科学家可以通过多种方式与系统互动,包括直接提供他们自己的初始想法以供探索,或以自然语言对生成的输出提供反馈。AI co-scientist 还利用网络搜索和专门的 AI 模型等工具,以增强生成假设的基础性和质量。

图示:AI co-scientist 多智能体系统中不同组件的图示以及系统与科学家之间的交互范式。

AI co-scientist 将指定目标解析为研究计划配置,并由一个监督者智能体(Supervisor agent)进行管理。监督者智能体将专门的任务分配给工作队列中的各个智能体,并分配资源。这种设计使得系统能够灵活地扩展计算能力,并针对指定研究目标迭代改进其科学推理能力。

扩展测试时计算(test-time compute)

以提升科学推理能力

AI co-scientist 利用测试时计算扩展,来迭代推理、演化和改进输出。关键的推理步骤包括基于自我对弈科学辩论生成新假设、通过排名竞赛进行假设比较、通过「进化」过程提升输出质量。系统的自主性支持递归自我批判,包括使用工具获取反馈以优化假设和提案。

系统的自我改进依赖于 Elo 自动评估指标。鉴于其核心作用,研究团队评估了更高的 Elo 评分是否与更高的输出质量相关,具体来说是分析了 Elo 自动评分与 GPQA 基准测试中 Diamond 难题集准确率的一致性,发现 Elo 评分与正确答案概率呈正相关。

图示:AI co-scientist(蓝线)与 Gemini 2.0(红线)在 GPQA Diamond 问题上回答的平均准确率,按 Elo 评分分组。该 Elo 评分为自我评估,并非基于独立的真实基准。

七位领域专家在其专业领域内整理了 15 个开放研究目标及其最佳猜测解决方案。通过使用自动化的 Elo 评分指标,研究团队观察到 AI co-scientist 在这些复杂问题上的表现优于其他 SOTA 智能体和推理模型。随着系统花费更多时间进行推理和改进,AI co-scientist 甚至超越了未受协助的人类专家。

图示:随着系统在计算上花费更多时间,AI co-scientist 的表现会有所提升。

在一个包含 11 个研究目标的子集中,专家们评估了 AI co-scientist 生成结果的新颖性和影响力,并将其与其他相关基线进行了比较,并提供了总体偏好。虽然样本量较小,但专家们认为 AI co-scientist 在新颖性和影响力方面具有更高潜力,并且相比于其他模型更倾向于选择 AI co-scientist 的输出。此外,这些人类专家的偏好似乎也与 Elo 自动评估指标相一致。

图示:人类专家评估认为:AI co-scientist 在新颖性和影响力方面具有更高潜力,并且相比于其他模型更倾向于选择 AI co-scientist 的输出。

通过现实实验验证 AI co-scientist 的新颖假设

为了评估 AI co-scientist 在新颖预测上的实际效用,研究团队在三个关键生物医学应用领域进行了端到端实验室实验,包括药物再利用、提出新的治疗靶点、阐明抗菌素耐药性的机制。这些实验均涉及专家指导,并涵盖一系列复杂性:

图示:实验概况。

以药物再利用为例,AI co-scientist 成功提出了急性髓性白血病(AML)的新型再利用候选药物。并且随后的实验验证了其提议,证实所建议药物在临床相关浓度下抑制了肿瘤活力。

图示:三种 AI co-scientist 预测的 AML 再利用药物之一的剂量 - 反应曲线。

值得一提的是,在阐明抗菌素耐药性机制测试中,专家研究人员指示 AI co-scientist 探索一个已在其团队中取得新发现但尚未公开的课题,即解释形成衣壳的噬菌体诱导染色体岛(cf-PICIs)如何在多种细菌物种中存在。AI co-scientist 独立提出,cf-PICIs 通过与多种噬菌体尾部相互作用来扩展其宿主范围。这展示了 AI co-scientist 的科研辅助价值。

图示:AI co-scientist 重新发现新型基因转移机制的时间线。

相关报道:https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖PCR、细胞实验、蛋白研究、神经科学、肿瘤免疫、基因编辑、外泌体、类器官等领域,定期分享实验干货、文献解读等活动。

添加实验菌企微,回复【】中的序号,即可领取对应的资料包哦~

【2401】论文写作干货资料(100 页)

【2402】国内重点实验室分子生物学实验方法汇总(60 页)

【2403】2024 最新最全影响因子(20000+ 期刊目录)

【2404】免疫学信号通路手册

【2405】PCR 实验 protocol 汇总

【2406】免疫荧光实验 protocol 合集

【2407】细胞培养手册

【2408】蛋白纯化实验手册

【2501】染色体分析方法汇总

【2502】国自然中标标书模板

【2503】WB 实验详解及常见问题解答

【2504】DeepSeek 论文写作常用口令

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重启首日崩了,崩就对了:为什么挤着回天涯?

重启首日崩了,崩就对了:为什么挤着回天涯?

鲁八两
2026-06-01 15:45:07
给他追封“民族英雄”,我不认同!

给他追封“民族英雄”,我不认同!

小豫讲故事
2026-06-02 06:00:29
国家出手,60岁释永信下场大快人心,倒霉的5个女人也出了口恶气

国家出手,60岁释永信下场大快人心,倒霉的5个女人也出了口恶气

云舟史策
2026-06-01 19:34:24
为什么家里不要随便装监控?很多人都不知道内情,看完涨知识了

为什么家里不要随便装监控?很多人都不知道内情,看完涨知识了

小俊分享
2026-06-02 12:07:15
湖北男子离婚当晚杀害前妻后逃亡17年案将开庭,受害人女儿:他家暴、转移妈妈房产、多次威胁杀人,该案抗诉成功;其一审被判死缓

湖北男子离婚当晚杀害前妻后逃亡17年案将开庭,受害人女儿:他家暴、转移妈妈房产、多次威胁杀人,该案抗诉成功;其一审被判死缓

大象新闻
2026-06-02 14:47:53
52岁卡纳瓦罗率队0-2不敌世界杯东道主,中亚劲旅3连胜终结

52岁卡纳瓦罗率队0-2不敌世界杯东道主,中亚劲旅3连胜终结

侧身凌空斩
2026-06-02 11:09:47
德甲U19国青球员火了!法媒赞谢初筠:中国队的引擎

德甲U19国青球员火了!法媒赞谢初筠:中国队的引擎

新英体育
2026-06-02 11:40:57
日媒称“日本人不去中国,中国旅游业遭重创”!日网友嗨翻:他们失去日本游客很难受!

日媒称“日本人不去中国,中国旅游业遭重创”!日网友嗨翻:他们失去日本游客很难受!

东京新青年
2026-05-31 18:08:07
今日最惨股,6个跌停后昨日再跌90%,今又跌停,重仓的亏得心碎!

今日最惨股,6个跌停后昨日再跌90%,今又跌停,重仓的亏得心碎!

丁丁鲤史纪
2026-06-02 14:25:39
过于狂妄!迪班萨:如果奇才选我为状元 吹杨需要将3号球衣让出来

过于狂妄!迪班萨:如果奇才选我为状元 吹杨需要将3号球衣让出来

仰卧撑FTUer
2026-06-02 10:43:05
库里官宣签约李宁十年!勇士两大核心都签约李宁

库里官宣签约李宁十年!勇士两大核心都签约李宁

体坛周报
2026-06-02 08:00:13
中国话音刚落,欧尔班有望接替古特雷斯,成为新任联合国秘书长?

中国话音刚落,欧尔班有望接替古特雷斯,成为新任联合国秘书长?

影孖看世界
2026-06-01 15:55:36
总决赛情报员!索汉支招尼克斯防守前队友文班:他很容易体能透支

总决赛情报员!索汉支招尼克斯防守前队友文班:他很容易体能透支

罗说NBA
2026-06-02 07:10:43
A股:紧急提醒2.5亿股民!从6月3日起,A股或将重启反弹浪大行情?

A股:紧急提醒2.5亿股民!从6月3日起,A股或将重启反弹浪大行情?

趋势清风侠
2026-06-02 15:46:46
35页PPT疯传:洛阳女子1女谈3男,每天卡时间,都已谈婚论嫁

35页PPT疯传:洛阳女子1女谈3男,每天卡时间,都已谈婚论嫁

烈史
2026-05-30 13:23:41
库里签约李宁登全美热搜!萌神称永久友谊 美记透露商业布局细节

库里签约李宁登全美热搜!萌神称永久友谊 美记透露商业布局细节

颜小白的篮球梦
2026-06-02 07:38:52
5天3王炸!中国科技将进入大爆发周期,西方彻底看懵了

5天3王炸!中国科技将进入大爆发周期,西方彻底看懵了

瓦伦西亚月亮
2026-06-02 01:06:25
真为深圳太子湾K11着急!干净到零异味,却留不住客流,评论炸锅

真为深圳太子湾K11着急!干净到零异味,却留不住客流,评论炸锅

火山詩话
2026-06-02 10:53:19
震碎NBA!父子同队进总决赛!历史首次!

震碎NBA!父子同队进总决赛!历史首次!

柚子说球
2026-06-01 17:28:09
代价拉满!记者曝四方大交易,火箭7换2,如愿得到杰伦·布朗

代价拉满!记者曝四方大交易,火箭7换2,如愿得到杰伦·布朗

体育见习官
2026-06-02 14:00:31
2026-06-02 17:31:00
生物学霸 incentive-icons
生物学霸
科研资讯平台
10764文章数 31260关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

游戏
教育
亲子
旅游
公开课

刺客信条:侠隐独占手游无PC版!中国刺客不配3A画质?

教育要闻

教育部等部门开展护航行动助力“平安高考”

亲子要闻

到底谁吃的?

旅游要闻

安徽六安:“非遗+”赋能全域旅游

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版