网易首页 > 网易号 > 正文 申请入驻

AI协助科学研究:GPT-5加速实验创新,打造由人工智能驱动的平台

0
分享至



科学塑造了从人类健康、能源生产到对宇宙的理解的方方面面。如果人工智能能够加速科学发展——缩短产生新想法或从想法到经过验证的结果的时间——那么这些益处将在社会中叠加。

但在这里,创新的开发速度依旧是一个限制。即使有了好的创意,将其转化为实际产品也需要一定时间。在近期调查中,60% 的美国人表示科学和医学突破传达得太慢;73% 的人表示我们需要更好的方法来加快发现进程;69% 的人将科学领导力视为人类的首要任务。



在 OpenAI 与范德堡大学、加州大学伯克利分校、哥伦比亚大学、牛津大学、剑桥大学、劳伦斯利弗莫尔国家实验室和杰克逊实验室等大学和国家实验室合作者共同撰写的论文「Early science acceleration experiments with GPT-5」中,他们详细阐述了 GPT-5 帮助研究人员以新颖方式综合已知结果,进行有力的文献综述,加速艰难计算,甚至生成未解命题的新证明。

相关信息:https://openaiglobalaffairs.substack.com/p/speeding-up-science-with-corrected

这些案例研究表明,在专家手中,GPT-5 正在加速科学发现,以及为什么这种加速很重要:

  • 生物学:由 Derya Unutmaz 医学博士领导的一项研究中,科学家们花费数月时间试图解释人类免疫细胞中一个令人费解的变化。GPT-5 在几分钟内从一份未发表的图表中识别出可能的机制,并提出了一项实验来证明它。这种速度可以帮助研究人员更快地理解疾病,并开发出更好的治疗方法。
  • 数学:另一个案例中,研究人员 Mehtaab Sawhney 和 Mark Sellke 正在解决由 Paul Erdős 最初提出的、持续数十年的开放性问题。他们卡在了最后一步,而 GPT-5 贡献了一个关于某个奇数如何打破模式的新想法,帮助他们完成了证明。这样的进展加强了众多算法和安全性技术最终所依赖的数学基础。
  • 算法与优化:研究人员 Sébastien Bubeck 和 Christian Coester 正在测试一种在机器人和路径规划中常用的决策方法,以求证它是否像人们所假设的那样可靠。GPT-5 发现了一个新的、清晰的例子,表明该方法可能会失败,并改进了优化中的一个经典结果,即用于确定解决问题最佳方法的数学方法。这类进展有助于工程师更好地理解机器人和路径规划中使用的决策系统以及其他现实应用中的决策系统。

OpenAI for Science 是什么?

OpenAI for Science 的使命是加速科学发现:帮助研究人员探索更多想法,更快地测试假设,并发现原本需要大量时间才能揭示的见解。这需要 OpenAI 团队通过将前沿模型与合适的工具、工作流程和合作相结合来实现这一目标。

团队为了获取模型的评估,通常会与学术界、工业界和国家实验室的研究人员紧密合作,从文献综述和证明生成到建模、模拟和实验设计这些反馈中获取改进的方向。

这其中的方法结合了两种互补的信念。专业的科学工具与扩展基础模型。前者对于效率和精确性至关重要。后者则解锁全新的推理能力:跨领域连接思想、勾勒证明、提出机制等。团队希望使用者在专业工具可用的时候积极采纳;对于那些需要一般推理的,团队也在构建针对性模型,这两者是相互强化的。

GPT-5 在科学工作中的当前状态

科学家设定如下议程:定义问题、选择方法、批判思想并验证结果。在这个过程中,GPT-5 贡献了广度、速度以及在并行探索许多方向的能力;研究人员学习如何提出问题、何时提出异议、如何将问题分解为步骤,以及什么需要独立验证。这就像迭代——对话并反馈直到放弃或给出解答。

早期研究中,专家使用 GPT-5 似乎能够缩短研究工作流程的部分环节。它不会自主运行项目或解决科学问题,但它可以扩展探索的广度,并帮助研究人员更快地接近正确结果。

一项新兴的能力是概念性文献检索。GPT-5 通常能够识别思想之间的深层关系,并跨语言和难以获取的来源检索相关材料。在数学和理论计算机科学领域,GPT-5 可以在几分钟内生成可行的证明大纲,将原本可能需要数天或数周的工作转变为高效完成。在生物学和其他经验科学中,该模型可以提出机制并设计实验,以在湿实验室中验证这些假设。

实验中的案例研究

GPT-5 能在科学前沿重新发现已知结果,比如说,寻求数学中的优化。它协助探讨了梯度下降访问的值序列在随时间形成凸曲线(没有凹陷的曲线)的情况,并给出了一个更清晰、更标准的证明,甚至从头推导出了最优界限。



相关链接:https://arxiv.org/abs/2503.10138

此外,它还能将一个新的几何结果与其他领域联系起来。它指出了与一个凸几何中的得证定理相关的密度估计、学习理论和多目标优化方面的工作,并提出了具体的参考文献,有些甚至连提问者都未曾见过。

同样,GPT-5 也可以作为合作伙伴,在多个组合学案例中,GPT-5 迅速发现候选结构中的缺陷或遗漏的情况,并提出了更简单的替代方案或反例;在其他情况下,它停滞不前或未能取得进展。尽管这未能达到提问者对于完全合著的标准,其在压缩时间等方面上还是卓有成效。

局限性与下一阶段发展

专家监督仍然至关重要。GPT-5 有时会虚构看似合理的引用、机制或证明;它可能对框架搭建和预热问题敏感;有时会忽略特定领域的细微之处;若未得到纠正,它还可能遵循无益的推理路径。对于这些活跃的研究领域,研发团队正与合作伙伴合作,在优化未来系统时测量并缓解这些缺陷。

综合来看,这些早期研究表明,GPT-5 开始帮助进行新型科学工作。该模型并非自主,但在专家手中,它可以帮助证明定理、重新发现和扩展结构、揭示跨领域的联系,并为科学家生成机制和实验以进行验证。

可以看到,这些系统随着时间的推移和计算能力的提升而不断改进。如果 GPT-5 能够在 20 分钟内对某些研究问题提供有意义的帮助,团队预计模型的推理效果将会随着时间而递增。结合世界一流的科学家,这指向了科学生产力随时间发生飞跃式进步的可能性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

清茶浅谈
2025-01-18 15:14:28
国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

带你感受人间冷暖
2026-01-25 00:20:06
不到24小时,19国同意加入,特朗普却突然改口,向联合国释放信号

不到24小时,19国同意加入,特朗普却突然改口,向联合国释放信号

天气观察站
2026-01-26 01:07:23
那英凭新造型火上热搜,58岁曼妙身材超吸睛,美到让人挪不开眼

那英凭新造型火上热搜,58岁曼妙身材超吸睛,美到让人挪不开眼

春风笑语
2026-01-22 11:48:21
平价白菜检出剧毒农药 央视一曝光 买菜的人全慌了

平价白菜检出剧毒农药 央视一曝光 买菜的人全慌了

坠入二次元的海洋
2026-01-24 12:56:20
瑞丽30周年,袁姗姗斗鸡眼,黄奕脸部僵硬,还不如72岁的赵雅芝

瑞丽30周年,袁姗姗斗鸡眼,黄奕脸部僵硬,还不如72岁的赵雅芝

白面书誏
2026-01-26 00:36:39
中药立大功!多项研究:2个中成药可保护大脑功能,成抗衰利器

中药立大功!多项研究:2个中成药可保护大脑功能,成抗衰利器

垚垚分享健康
2026-01-21 10:45:40
最近很火的七年低息买车,原来有这么多套路。。。

最近很火的七年低息买车,原来有这么多套路。。。

差评XPIN
2026-01-24 00:05:35
普通人进步最快的方式是什么?看网友的分享我醍醐灌顶,全是细糠

普通人进步最快的方式是什么?看网友的分享我醍醐灌顶,全是细糠

另子维爱读史
2026-01-25 20:16:05
《镖人》垫底了,吴京不敌张艺谋和沈腾,400亿票房梦要碎了

《镖人》垫底了,吴京不敌张艺谋和沈腾,400亿票房梦要碎了

影视高原说
2026-01-25 10:05:47
直到央媒公开“点名”朱亚文,才明白,原来李幼斌一个字都没说错

直到央媒公开“点名”朱亚文,才明白,原来李幼斌一个字都没说错

小嵩
2026-01-26 01:35:56
拒绝百万年薪,入职25万事业编,效力辽篮18年的韩德君赚到多少钱

拒绝百万年薪,入职25万事业编,效力辽篮18年的韩德君赚到多少钱

揽星河的笔记
2026-01-25 20:19:21
澳网无缘八强,小米辣情绪失控,输球不可怕,输给自己最扎心

澳网无缘八强,小米辣情绪失控,输球不可怕,输给自己最扎心

何揎室内设计
2026-01-25 23:33:15
美国乒乓职业大联盟创始人公开质疑:樊振东世界排名缺失问题!

美国乒乓职业大联盟创始人公开质疑:樊振东世界排名缺失问题!

开成运动会
2026-01-24 22:10:21
“受够了美国!”卡梅隆选择新西兰,暗示美国即将崩溃?

“受够了美国!”卡梅隆选择新西兰,暗示美国即将崩溃?

粉红冻奶的观影日记
2026-01-25 20:00:06
两位女主播互相爆料,各自都有黑人男友,亲密合照还被曝光

两位女主播互相爆料,各自都有黑人男友,亲密合照还被曝光

新游戏大妹子
2026-01-23 12:30:08
霍家没想到,纵横跳水界多年的儿媳郭晶晶,竟遭到一个这么大教训

霍家没想到,纵横跳水界多年的儿媳郭晶晶,竟遭到一个这么大教训

陈意小可爱
2026-01-25 15:24:51
弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

木言观
2026-01-18 13:56:24
巴厘岛夜场爆冲突!哈萨克斯坦模特喊“荣耀乌克兰”揍俄罗斯模特

巴厘岛夜场爆冲突!哈萨克斯坦模特喊“荣耀乌克兰”揍俄罗斯模特

老马拉车莫少装
2026-01-24 21:44:07
芒果高层聚会!副台长汪涵跷腿夹手机,编外人员何炅端坐像听讲学生

芒果高层聚会!副台长汪涵跷腿夹手机,编外人员何炅端坐像听讲学生

八星人
2026-01-25 11:30:30
2026-01-26 03:12:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1216文章数 223关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

艺术
旅游
教育
本地
军事航空

艺术要闻

这些肖像看完直呼“爽”!真是好久都没有看到了!

旅游要闻

钢城“后花园”开出振兴之花,看聚源桥村如何玩转“三村联动”

教育要闻

西藏考生必看!合肥工业大学招生计划揭秘

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版