网易首页 > 网易号 > 正文 申请入驻

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

0
分享至

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——

为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。

划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。

据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。

而且趁热打铁,谷歌这次还面向全球科学家推出了一个“可信测试计划”,大家现在都可以申请。

另外,从致谢名单可以看到,这项研究集齐了谷歌内部豪华阵容,包括Google Research、Deepmind以及Cloud AI teams,还有顶尖高校科学家参与测试……

正如网友所言,说不定AI智能体未来某天就获得诺贝尔奖了。

文献综述/提出假设/报告一条龙搞定

直接来看AI co-scientist的运作过程

其目标非常清晰,当科学家文字给出研究主题后,它会借助多个AI智能体帮助生成新的研究假设、详细的研究概述和实验方案。

参与其中的智能体包括但不限于:

  • 生成(Generation):提出新的假设或想法
  • 反思(Reflection):评估和分析生成的假设
  • 排名(Ranking):对假设进行优先级排序
  • 进化(Evolution):通过迭代改进假设
  • 邻近性(Proximity):探索与现有知识相近或相关的领域
  • 元审查(Meta-review):对整个过程进行监督和优化

这些智能体通过自动化反馈不断迭代,生成、评估和改进假设,从而形成自我优化循环,最终输出高质量研究方案。

而作为科学家,具体可以通过以下几种方式参与协作。

比如最开始给系统提供粗略的想法或一些研究主题or方向,让它帮你进一步细化;或者对AI的输出提供自然语言反馈,让它进一步调整。

此外,科学家还能使用其他工具,如网络搜索或一些专业领域的AI模型,来进一步提高研究质量。

深挖二者具体协作过程,还能看到当科学家提出研究目标后,有一个监督智能体(Supervisor Agent)来负责工作分配。

  • 专业智能体(红色框,具有独特的角色和逻辑);
  • 科学家的输入和反馈(蓝色框);
  • 系统信息流(深灰色箭头);
  • 智能体间的反馈(智能体内部的红色箭头)。

从上面可以看出,整个AI co-scientist系统的运作较为简单。

测试时间计算用于科学发现

当然,这项研究的主要亮点是:

扩展测试时间计算(test-time)来大大增强其推理能力,包括上面提到的自我对弈、假设排名和进化过程等关键推理步骤。

在研究中,AI co-scientist利用Elo评级系统来衡量和提升其在解决科学问题方面的能力。

具体而言,Elo评级是一个动态的评估指标,通常用于衡量比赛者的相对技能水平。研究人员对比了AI co-scientist(蓝色线)和Gemini 2.0(红色线)在GPQA(General Problem-solving Question Answering)基准测试上的平均准确率。

结果发现,高Elo评级的系统在解决挑战性问题时,能够提供更准确答案。(正相关)

这表明了,Elo评级可以作为一个有效的指标,用来预测和提升AI co-scientist在科学问题解决方面的性能。

接下来,七位领域专家精选了15个开放的研究目标,并提出了相应的最佳解决方案。

目标是,利用自动化的Elo评估指标,来对比AI co-scientist和其他最先进智能体和推理模型(Gemini 2.0 Pro版本和推理版本,以及人类专家)在解决这些复杂问题上的表现

结果显示,AI co-scientist明显表现最佳。

此外,随着AI系统投入更多时间进行推理和改进,其自我评估的质量得到了显著提升,甚至超出了传统模型以及在某些情况下无法解决问题的人类专家的水平。

更关键的,基于对11个研究目标子集的分析,专家评估认为AI co-scientist在新颖性影响力方面的表现优于其他基线模型。

为了进一步评估AI co-scientist用于科学发现的实际潜力,研究团队进行了一系列端到端的实验室实验。

这些实验专注于三个关键的生物医学领域:药物再利用、新治疗靶点的提出以及抗菌耐药性的背后机制

实验中,AI co-scientist不仅受到了专家的指导和反馈,而且涵盖了从简单到复杂的多种研究场景。

话不多说,我们具体来看其取得的初步成果。

首先,药物再利用是一种将已经批准用于其他疾病的药物用于治疗新疾病的策略。这种方法能够缩短药物开发的时间和成本,并且可以快速地将有效的治疗方案带给患者。

这一次,研究人员将目光瞄准了急性髓系白血病(AML),AI co-scientist通过分析大量的生物医学数据,包括药物的化学结构、药效学和遗传信息,来预测哪些现有药物可能对AML有效。

最终,AI co-scientist提出了3种可能药物。而且在进一步验证中,它所建议的药物在多个AML细胞系中,以临床相关的浓度抑制了肿瘤的活力,证明了其有效性。

而比药物再利用更复杂的识别新型治疗靶点中,研究人员聚焦于肝纤维化这种疾病。

肝纤维化的治疗是当前肝病研究的重点,而寻找有效的治疗靶点是关键。

过程中,AI co-scientist通过对大量生物医学数据的分析,包括基因表达谱、蛋白质互作网络和已知药物数据库,来识别与肝纤维化相关的关键分子和生物学路径。

对比它所提出的一系列潜在治疗方案,和传统的纤维化诱导剂(作为阴性对照)以及抑制剂(作为阳性对照)来看,所有由AI co-scientist建议的药物都显示出有希望的活性(p值小于0.01)。

这意味着这些药物在治疗肝纤维化方面具有很高的可能性。

最后,在第三次实验中,通过分析大量的遗传学、蛋白质结构和药物活性数据,AI co-scientist也被发现能够识别和预测细菌耐药的潜在机制。

具体而言,在囊膜形成噬菌体诱导的染色体岛(cf-PICIs)中,研究人员利用AI co-scientist的能力来探索cf-PICIs在多种细菌物种中的存在和功能机制。

AI co-scientist通过分析和整合大量的生物学文献和数据,独立提出了一个新的假设:

cf-PICIs可能通过与多种噬菌体尾部相互作用来扩大其宿主范围。

而这一假设得到了实验室实验的验证。

不过需要提醒,尽管AI co-scientist已经在科学发现上取得一系列初步成果,但谷歌也点出了其局限性:

文献综述能力、事实核查、与外部工具的交叉检查、自动评估技术以及更大规模的评估等,均需要进一步完善。

现在,感兴趣的研究人员or团队可以申请一波了~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亚足联严查!西亚裁判再次针对国足,点球不判+胡乱给黄牌,离谱

亚足联严查!西亚裁判再次针对国足,点球不判+胡乱给黄牌,离谱

球盲百小易
2026-01-18 01:48:22
周总理逝世21年后,中国银行核查账目时发现他名下存有巨额存款,一番调查后揭开了背后的真相

周总理逝世21年后,中国银行核查账目时发现他名下存有巨额存款,一番调查后揭开了背后的真相

寄史言志
2026-01-17 16:37:15
贾国龙要求道歉,罗永浩承认冷冻西蓝花“成本更高”!一斤西蓝花从两块多升值到20多元,业内人士:速冻的可能比新鲜菜更好

贾国龙要求道歉,罗永浩承认冷冻西蓝花“成本更高”!一斤西蓝花从两块多升值到20多元,业内人士:速冻的可能比新鲜菜更好

每日经济新闻
2026-01-17 12:33:05
离开了旧金山我才敢坦白:那里的治安已经到了让人毛骨悚然的地步

离开了旧金山我才敢坦白:那里的治安已经到了让人毛骨悚然的地步

深度报
2026-01-17 22:51:25
关于“挨过饿”的问题,本人就草率使用这张图片公开道歉

关于“挨过饿”的问题,本人就草率使用这张图片公开道歉

读鬼笔记
2026-01-15 20:03:51
皮夹克!金正恩出席朝鲜2026年首次国家活动

皮夹克!金正恩出席朝鲜2026年首次国家活动

IN朝鲜
2026-01-17 10:44:02
7国出兵不到48小时,特朗普通告全球:谁挡美国夺岛,就给谁加税

7国出兵不到48小时,特朗普通告全球:谁挡美国夺岛,就给谁加税

军机Talk
2026-01-17 15:06:12
李亚鹏必须道歉,否则房租涨价也不会租给他了,房东最新回应

李亚鹏必须道歉,否则房租涨价也不会租给他了,房东最新回应

汉史趣闻
2026-01-17 17:40:36
刚刚 | 罗永浩再发朋友圈!

刚刚 | 罗永浩再发朋友圈!

天津广播
2026-01-17 23:56:20
贾国龙请来助拳的人,打了贾国龙一拳

贾国龙请来助拳的人,打了贾国龙一拳

不主流讲话
2026-01-17 10:10:06
刚刚,《科学》重磅发布:高血压元凶找到了!

刚刚,《科学》重磅发布:高血压元凶找到了!

徐德文科学频道
2026-01-17 21:42:49
93分钟绝杀!弗兰克不敢相信:5场不胜太耻辱,8.7亿欧豪阵也没用

93分钟绝杀!弗兰克不敢相信:5场不胜太耻辱,8.7亿欧豪阵也没用

足球狗说
2026-01-18 01:02:52
贾国龙深夜发声:罗永浩让西贝雪上加霜,“西贝断崖式亏损,他直播间销售额增加5倍”!罗永浩:已被禁言15天,不会再回应

贾国龙深夜发声:罗永浩让西贝雪上加霜,“西贝断崖式亏损,他直播间销售额增加5倍”!罗永浩:已被禁言15天,不会再回应

每日经济新闻
2026-01-18 01:35:09
曼联2-0曼城进前4!卡里克能阿莫林所不能,坚决战术打爆保守瓜帅

曼联2-0曼城进前4!卡里克能阿莫林所不能,坚决战术打爆保守瓜帅

罗米的曼联博客
2026-01-18 00:03:57
内存条价格暴涨,电脑组装涨价一至两千元,业内人士:可能还会涨,非刚需不建议买

内存条价格暴涨,电脑组装涨价一至两千元,业内人士:可能还会涨,非刚需不建议买

环球网资讯
2026-01-17 07:42:06
刷新历史!中国U23男足进入亚洲杯四强

刷新历史!中国U23男足进入亚洲杯四强

界面新闻
2026-01-17 22:17:49
这个周末,陈小群深陷舆论漩涡!一张截图刷屏,大佬说教陈小群

这个周末,陈小群深陷舆论漩涡!一张截图刷屏,大佬说教陈小群

金石随笔
2026-01-18 00:06:02
轰23脚仍出局!乌兹主帅道歉 被U23国足3点所震撼:李昊未来光明

轰23脚仍出局!乌兹主帅道歉 被U23国足3点所震撼:李昊未来光明

我爱英超
2026-01-17 23:42:28
被多国退货,演习不敌歼10C,实战被击落,中国的苏35还有啥用?

被多国退货,演习不敌歼10C,实战被击落,中国的苏35还有啥用?

军机Talk
2026-01-16 12:02:56
高调炫富仅是冰山一角!李湘被封禁不到一天,曝出的猛料太炸裂

高调炫富仅是冰山一角!李湘被封禁不到一天,曝出的猛料太炸裂

青橘罐头
2026-01-17 21:20:43
2026-01-18 08:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12023文章数 176360关注度
往期回顾 全部

科技要闻

两枚火箭发射失利,具体原因正排查

头条要闻

美国因格陵兰岛问题对欧洲8国加关税 多国反击特朗普

头条要闻

美国因格陵兰岛问题对欧洲8国加关税 多国反击特朗普

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

旅游
游戏
时尚
房产
军事航空

旅游要闻

40载冰灯映初心:龙庆峡用一场冰雪盛宴,唤醒三代人的集体记忆!

这下好了,英伦侦探风也给老钟玩懂了"/> 主站 商城 论坛 自运营 登录 注册 这下好了,英伦侦探风也给老钟玩懂了 廉颇 2026-01-17 返回专栏...

“这个风格”今年冬天又火了!谁穿谁高级

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

军事要闻

普京谈及当前国际局势:世界太危险了

无障碍浏览 进入关怀版