网易首页 > 网易号 > 正文 申请入驻

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现

0
分享至

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——

为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。

划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。

据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。

而且趁热打铁,谷歌这次还面向全球科学家推出了一个“可信测试计划”,大家现在都可以申请。

另外,从致谢名单可以看到,这项研究集齐了谷歌内部豪华阵容,包括Google Research、Deepmind以及Cloud AI teams,还有顶尖高校科学家参与测试……

正如网友所言,说不定AI智能体未来某天就获得诺贝尔奖了。

文献综述/提出假设/报告一条龙搞定

直接来看AI co-scientist的运作过程

其目标非常清晰,当科学家文字给出研究主题后,它会借助多个AI智能体帮助生成新的研究假设、详细的研究概述和实验方案。

参与其中的智能体包括但不限于:

  • 生成(Generation):提出新的假设或想法
  • 反思(Reflection):评估和分析生成的假设
  • 排名(Ranking):对假设进行优先级排序
  • 进化(Evolution):通过迭代改进假设
  • 邻近性(Proximity):探索与现有知识相近或相关的领域
  • 元审查(Meta-review):对整个过程进行监督和优化

这些智能体通过自动化反馈不断迭代,生成、评估和改进假设,从而形成自我优化循环,最终输出高质量研究方案。

而作为科学家,具体可以通过以下几种方式参与协作。

比如最开始给系统提供粗略的想法或一些研究主题or方向,让它帮你进一步细化;或者对AI的输出提供自然语言反馈,让它进一步调整。

此外,科学家还能使用其他工具,如网络搜索或一些专业领域的AI模型,来进一步提高研究质量。

深挖二者具体协作过程,还能看到当科学家提出研究目标后,有一个监督智能体(Supervisor Agent)来负责工作分配。

  • 专业智能体(红色框,具有独特的角色和逻辑);
  • 科学家的输入和反馈(蓝色框);
  • 系统信息流(深灰色箭头);
  • 智能体间的反馈(智能体内部的红色箭头)。

从上面可以看出,整个AI co-scientist系统的运作较为简单。

测试时间计算用于科学发现

当然,这项研究的主要亮点是:

扩展测试时间计算(test-time)来大大增强其推理能力,包括上面提到的自我对弈、假设排名和进化过程等关键推理步骤。

在研究中,AI co-scientist利用Elo评级系统来衡量和提升其在解决科学问题方面的能力。

具体而言,Elo评级是一个动态的评估指标,通常用于衡量比赛者的相对技能水平。研究人员对比了AI co-scientist(蓝色线)和Gemini 2.0(红色线)在GPQA(General Problem-solving Question Answering)基准测试上的平均准确率。

结果发现,高Elo评级的系统在解决挑战性问题时,能够提供更准确答案。(正相关)

这表明了,Elo评级可以作为一个有效的指标,用来预测和提升AI co-scientist在科学问题解决方面的性能。

接下来,七位领域专家精选了15个开放的研究目标,并提出了相应的最佳解决方案。

目标是,利用自动化的Elo评估指标,来对比AI co-scientist和其他最先进智能体和推理模型(Gemini 2.0 Pro版本和推理版本,以及人类专家)在解决这些复杂问题上的表现

结果显示,AI co-scientist明显表现最佳。

此外,随着AI系统投入更多时间进行推理和改进,其自我评估的质量得到了显著提升,甚至超出了传统模型以及在某些情况下无法解决问题的人类专家的水平。

更关键的,基于对11个研究目标子集的分析,专家评估认为AI co-scientist在新颖性影响力方面的表现优于其他基线模型。

为了进一步评估AI co-scientist用于科学发现的实际潜力,研究团队进行了一系列端到端的实验室实验。

这些实验专注于三个关键的生物医学领域:药物再利用、新治疗靶点的提出以及抗菌耐药性的背后机制

实验中,AI co-scientist不仅受到了专家的指导和反馈,而且涵盖了从简单到复杂的多种研究场景。

话不多说,我们具体来看其取得的初步成果。

首先,药物再利用是一种将已经批准用于其他疾病的药物用于治疗新疾病的策略。这种方法能够缩短药物开发的时间和成本,并且可以快速地将有效的治疗方案带给患者。

这一次,研究人员将目光瞄准了急性髓系白血病(AML),AI co-scientist通过分析大量的生物医学数据,包括药物的化学结构、药效学和遗传信息,来预测哪些现有药物可能对AML有效。

最终,AI co-scientist提出了3种可能药物。而且在进一步验证中,它所建议的药物在多个AML细胞系中,以临床相关的浓度抑制了肿瘤的活力,证明了其有效性。

而比药物再利用更复杂的识别新型治疗靶点中,研究人员聚焦于肝纤维化这种疾病。

肝纤维化的治疗是当前肝病研究的重点,而寻找有效的治疗靶点是关键。

过程中,AI co-scientist通过对大量生物医学数据的分析,包括基因表达谱、蛋白质互作网络和已知药物数据库,来识别与肝纤维化相关的关键分子和生物学路径。

对比它所提出的一系列潜在治疗方案,和传统的纤维化诱导剂(作为阴性对照)以及抑制剂(作为阳性对照)来看,所有由AI co-scientist建议的药物都显示出有希望的活性(p值小于0.01)。

这意味着这些药物在治疗肝纤维化方面具有很高的可能性。

最后,在第三次实验中,通过分析大量的遗传学、蛋白质结构和药物活性数据,AI co-scientist也被发现能够识别和预测细菌耐药的潜在机制。

具体而言,在囊膜形成噬菌体诱导的染色体岛(cf-PICIs)中,研究人员利用AI co-scientist的能力来探索cf-PICIs在多种细菌物种中的存在和功能机制。

AI co-scientist通过分析和整合大量的生物学文献和数据,独立提出了一个新的假设:

cf-PICIs可能通过与多种噬菌体尾部相互作用来扩大其宿主范围。

而这一假设得到了实验室实验的验证。

不过需要提醒,尽管AI co-scientist已经在科学发现上取得一系列初步成果,但谷歌也点出了其局限性:

文献综述能力、事实核查、与外部工具的交叉检查、自动评估技术以及更大规模的评估等,均需要进一步完善。

现在,感兴趣的研究人员or团队可以申请一波了~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
先进封装迈向玻璃基板时代,国内面板巨头跑步入场,谁有望成为赢家?

先进封装迈向玻璃基板时代,国内面板巨头跑步入场,谁有望成为赢家?

华尔街见闻官方
2026-07-01 15:19:49
韩国球迷怒骂滚出去!洪明甫被护送出境,入境大厅仅停留 2 分钟

韩国球迷怒骂滚出去!洪明甫被护送出境,入境大厅仅停留 2 分钟

老黯谈娱
2026-07-02 01:53:08
湖人队昆廷·格莱姆斯与父亲的合影,仿佛注定他将成为湖人一员

湖人队昆廷·格莱姆斯与父亲的合影,仿佛注定他将成为湖人一员

好火子
2026-07-02 05:44:49
世界杯开赛至今,姆巴佩进6球,梅西进6球,哈兰德也进了5个球

世界杯开赛至今,姆巴佩进6球,梅西进6球,哈兰德也进了5个球

凉羽亭
2026-07-01 09:31:25
太专业!成都蓉城3050万改造专业足球场:1个赛季就回本

太专业!成都蓉城3050万改造专业足球场:1个赛季就回本

邱泽云
2026-07-01 22:17:57
40度高温奔现!女子化妆两小时,男友为省电不开空调,当场分手

40度高温奔现!女子化妆两小时,男友为省电不开空调,当场分手

原广工业
2026-06-30 19:37:24
单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

钉钉陌上花开
2026-07-01 10:41:57
倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

萌兰聊个球
2026-07-01 10:53:17
意大利前总理出轨成瘾,情妇无数个个性感,好色成性是AC米兰老板

意大利前总理出轨成瘾,情妇无数个个性感,好色成性是AC米兰老板

陈意小可爱
2026-07-02 00:16:03
新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

心理观察局
2026-06-26 07:37:08
南京市一栋独栋别墅2170万被拍卖,经过134轮的竞价,最终以5130万元成交

南京市一栋独栋别墅2170万被拍卖,经过134轮的竞价,最终以5130万元成交

童童聊娱乐啊
2026-07-01 16:50:41
京城迎来今夏首轮持续晴热天气

京城迎来今夏首轮持续晴热天气

北青网-北京青年报
2026-07-02 01:51:20
2800元新车未锁被偷 车主:“以为上海很安全”

2800元新车未锁被偷 车主:“以为上海很安全”

看看新闻Knews
2026-07-01 17:01:14
死亡半区不死亡了!法国队预定决赛名额? 媒体人:提防美国队胡搞

死亡半区不死亡了!法国队预定决赛名额? 媒体人:提防美国队胡搞

风过乡
2026-07-01 08:09:33
当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

轩逸阿II
2026-07-02 00:18:01
绿源电动车旗舰店被指擦边营销:多条视频已删除 客服致歉

绿源电动车旗舰店被指擦边营销:多条视频已删除 客服致歉

中国能源网
2026-06-30 18:35:06
埃尔多安呼吁摧毁以色列,兵力相差26万,内塔尼亚胡不敢轻举妄动

埃尔多安呼吁摧毁以色列,兵力相差26万,内塔尼亚胡不敢轻举妄动

离离言几许
2026-07-02 02:20:00
中国空调在欧洲卖爆,欧洲空调商预警:打不过中国制造,就改规则

中国空调在欧洲卖爆,欧洲空调商预警:打不过中国制造,就改规则

泠泠说史
2026-07-01 11:31:38
李谷一大胆开麦,揭露宋祖英走上高位的真相,观众:原来如此!

李谷一大胆开麦,揭露宋祖英走上高位的真相,观众:原来如此!

妙知
2026-07-01 04:32:57
天热跑步的“尴尬三幕”,女跑友直呼:太羞羞!

天热跑步的“尴尬三幕”,女跑友直呼:太羞羞!

马拉松跑步健身
2026-07-01 06:30:08
2026-07-02 06:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12880文章数 176508关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

健康
旅游
房产
数码
公开课

年糕汤圆别油炸,水煮清蒸更健康

旅游要闻

不用远赴外地,云南本地人的私藏赏花地,螺旋花海随手拍都是大片

房产要闻

洞察新局 | 2026年天河置业红盘图鉴

数码要闻

苹果MacBook全面涨价!2026年全球笔记本出货恐下跌13.6%

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版