网易首页 > 网易号 > 正文 申请入驻

成功率提高7倍!新方法一句话就能让AI秒出分子设计+合成步骤

0
分享至

寻找具备研发新药物和新材料所需特性分子的过程既繁琐又昂贵,需要耗费大量计算资源,研究人员往往要花费数月时间,才能在浩如烟海的候选分子中筛选出数量有限的目标分子。

像 ChatGPT 这样的大语言模型有望简化这一流程,然而,让大语言模型像理解句子中的单词那样理解和推理构成分子的原子与化学键却存在技术壁垒。

近期,麻省理工学院和 MIT-IBM 沃森人工智能实验室的研究人员开发出一种颇具前景的方法,利用基于图的模型(Graph-based Model)来增强大语言模型(这些模型专为生成和预测分子结构而设计)。

该方法通过基础大语言模型解析用户自然语言需求后,能在分子设计、原理阐释及合成路线规划等环节智能切换 AI 模块。

它将文本、图形和合成步骤生成交织在一起,把单词、图形和反应整合为一个通用词汇表,供大语言模型使用,实现多模态信息无缝衔接。

与现有的基于大语言模型的方法相比,这种多模态技术生成的分子更符合用户设定的规格,有效合成方案成功率从 5% 提升至 35%

该方法的效果优于规模比它大 10 倍以上、仅使用文本表示来设计分子和合成路线的大语言模型,这表明多模态融合是新系统成功的关键。

“这有望成为一个‘端到端’的解决方案,能实现分子设计与合成全过程的自动化。如果大语言模型能在几秒钟内给出答案,将为制药公司节省大量时间。”麻省理工学院研究生、该技术论文的合作者 Michael Sun 说道。

这项研究成果将在国际学习表征会议上发表。论文的合作者还包括圣母大学研究生 Gang Liu、麻省理工学院电气工程与计算机科学教授 Wojciech Matusik,以及 MIT-IBM 沃森人工智能实验室资深科学家 Jie Chen。这项研究部分由美国国家科学基金会、海军研究办公室以及 MIT-IBM 沃森人工智能实验室资助。

优势互补

大型语言模型并非为理解化学的微妙之处而设计,这也是它们难以进行逆向分子设计的原因之一。逆向分子设计是指识别具有特定功能或特性的分子结构的过程。

大语言模型将文本转换为一种名为标记的表示形式,用于按顺序预测句子中的下一个单词。但分子是由原子和化学键组成的“图形结构”,不存在特定顺序,这使得它们很难编码为顺序文本。

另一方面,基于图的模型将原子和分子键表示为图形中相互连接的节点和边。尽管这些模型在逆向分子设计中应用广泛,但它们需要复杂的输入,无法理解自然语言,且生成的结果可能难以解释。

麻省理工学院的研究人员将大语言模型与基于图的模型整合到一个统一框架中,实现了优势互补。

Llamole(Large Language Model for Molecule Discovery,分子发现大型语言模型)利用基础大语言模型作为“智能调度员”,理解用户的查询,即用户用通俗语言对具有特定属性分子的需求。

例如,用户在寻找一种分子量为 209、具有特定键特性,且能穿透血脑屏障并抑制 HIV 的分子。

当大语言模型响应用户查询预测文本时,系统会通过独特的“触发令牌”机制,在三大功能模块间智能切换:1、结构生成模块(基于图扩散模型,根据输入条件构建分子骨架);2、语义转换模块(通过图神经网络将分子结构重新编码为大语言模型可理解的词元);3、合成规划模块(根据中间体结构预测反应路径,逆向推导从基础原料到目标分子的完整合成方案)。

“这样做的精妙之处在于模块间的信息闭环,大语言模型在激活特定模块前生成的所有内容,都会输入到该模块中。该模块会以与之前一致的方式进行工作。”Michael Sun 说道,“同样,每个模块的输出都会经过编码,并反馈到大语言模型的生成过程中,这样大语言模型就能了解每个模块的作用,并继续根据这些数据预测标记。”

更优、更简单的分子结构

最终,Llamole 会输出分子结构图像、分子文本描述以及分步合成计划,该计划详细说明了如何合成分子,包括具体的化学反应。

在设计符合用户规格分子的实验中,Llamole 的表现优于 10 种标准大语言模型、4 种微调大语言模型,以及最先进的特定领域方法。同时,它通过生成更高质量的分子,将逆合成规划成功率从 5% 提升至 35%,这意味着这些分子结构更简单,构建模块成本更低。

“大语言模型自身很难确定如何合成分子,因为这需要大量多步骤规划。我们的方法能生成更优且更易合成的分子结构。”Gang Liu 说道。

为了训练和评估 Llamole,研究人员从头构建了两个数据集,因为现有的分子结构数据集细节不足。他们用 AI 生成的自然语言描述和自定义描述模板,对数十万个专利分子进行了扩充。

他们为微调大语言模型构建的数据集包含与 10 种分子特性相关的模板,因此 Llamole 的一个局限在于,它被训练为仅考虑这 10 种数值特性来设计分子。

在未来的研究中,研究人员希望扩展 Llamole 的功能,使其能够考虑任何分子特性。此外,他们还计划改进图形模块,提高 Llamole 的逆合成成功率。

从长远来看,他们希望利用这种方法拓展应用范围,超越分子领域,创建能处理其他图基数据的多模态大语言模型,例如电网中的互连传感器数据或金融市场中的交易数据。

“Llamole 展示了将大型语言模型用作处理文本描述之外复杂数据的接口的可行性,我们预计它们将成为与其他 AI 算法交互以解决各类图形问题的基础。”Jie Chen 说道。

https://news.mit.edu/2025/could-llms-help-design-our-next-medicines-and-materials-0409

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广厦队、上海队谁能夺冠?杨鸣给出了自己的看法

广厦队、上海队谁能夺冠?杨鸣给出了自己的看法

体育哲人
2026-05-24 09:46:44
突发!左跟腱撕裂,才狂砍50+17+6!NBA生涯彻底没了

突发!左跟腱撕裂,才狂砍50+17+6!NBA生涯彻底没了

体育新角度
2026-05-24 10:08:40
79岁黄百鸣法庭上求情,自曝患癌精神受打击,不想坐牢已决定退休

79岁黄百鸣法庭上求情,自曝患癌精神受打击,不想坐牢已决定退休

开开森森
2026-05-23 11:17:36
美国调整移民政策,申请绿卡须返回本国递交申请

美国调整移民政策,申请绿卡须返回本国递交申请

澎湃新闻
2026-05-23 12:24:21
新加坡媒体为何对《给阿嬷的情书》如此敏感?

新加坡媒体为何对《给阿嬷的情书》如此敏感?

手工制作阿歼
2026-05-24 05:40:18
70后夫妻“豪赌”芯片,三个月净赚了33亿

70后夫妻“豪赌”芯片,三个月净赚了33亿

毒sir财经
2026-05-23 22:52:50
福建本地人谈“毒杨梅”:果农们没必要委屈,你敢对妈祖发誓不知道泡药的事吗?

福建本地人谈“毒杨梅”:果农们没必要委屈,你敢对妈祖发誓不知道泡药的事吗?

风向观察
2026-05-23 21:39:35
监管形同虚设!杨梅泡药水事件,监管部门比黑心商家还要可恨

监管形同虚设!杨梅泡药水事件,监管部门比黑心商家还要可恨

爆角追踪
2026-05-23 16:14:07
燃油车集体大降价!45万元的奥迪降至26万元,宝马最高降超30万元!

燃油车集体大降价!45万元的奥迪降至26万元,宝马最高降超30万元!

新浪财经
2026-05-23 23:34:36
徐州名医去世!年仅56岁,当地患者悼念称其“贾半仙”“贾神仙”

徐州名医去世!年仅56岁,当地患者悼念称其“贾半仙”“贾神仙”

火山詩话
2026-05-24 07:36:55
4名赴泰失联近20天的中国男子被找到,原来都被骗至妙瓦底!

4名赴泰失联近20天的中国男子被找到,原来都被骗至妙瓦底!

听心堂
2026-05-23 20:47:44
周冬雨“拔萝卜”的瓜!

周冬雨“拔萝卜”的瓜!

八卦疯叔
2026-05-23 11:01:00
一找一个准!男子无意间救下的野猪变身“行走的挖笋雷达”,每年为他创收12万元

一找一个准!男子无意间救下的野猪变身“行走的挖笋雷达”,每年为他创收12万元

封面新闻
2026-05-23 22:34:20
北师大男生拒绝插空上桌吃饭,透露出的不是男女对立,是老师的无能!

北师大男生拒绝插空上桌吃饭,透露出的不是男女对立,是老师的无能!

人间运行手册
2026-05-23 08:01:42
爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

火山詩话
2026-05-24 06:41:17
因妈妈姓氏太过特殊,全家一致同意“随母姓”,网友:换做是我,也随母姓

因妈妈姓氏太过特殊,全家一致同意“随母姓”,网友:换做是我,也随母姓

品读时刻
2026-05-24 09:01:06
西决G4伤情出炉!米切尔缺阵杰伦威出战成疑 福克斯哈珀确定能打

西决G4伤情出炉!米切尔缺阵杰伦威出战成疑 福克斯哈珀确定能打

罗说NBA
2026-05-24 06:49:25
香港航天员黎家盈:三娃妈妈,贤妻良母,老公这句话让她下定决心

香港航天员黎家盈:三娃妈妈,贤妻良母,老公这句话让她下定决心

普陀动物世界
2026-05-23 14:26:00
浮嶋敏被架空?助教曹阳场边指挥比赛!原因曝光:对手毕竟是日本

浮嶋敏被架空?助教曹阳场边指挥比赛!原因曝光:对手毕竟是日本

念洲
2026-05-24 08:19:59
窦靖童在节目中称那英“老师”,却遭那英反问“叫我啥?” 曝婴儿时期叫“老那”,平时叫“那英阿姨”

窦靖童在节目中称那英“老师”,却遭那英反问“叫我啥?” 曝婴儿时期叫“老那”,平时叫“那英阿姨”

天津生活通
2026-05-23 14:47:55
2026-05-24 11:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16740文章数 514971关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

媒体:毛焦尔上任后 匈牙利对乌克兰政策"又变回去了"

头条要闻

媒体:毛焦尔上任后 匈牙利对乌克兰政策"又变回去了"

体育要闻

少年意气,正在改变中国足球

娱乐要闻

《浪姐7》三公,王濛赢麻了,张月实惨

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

时尚
教育
艺术
旅游
本地

初夏少不了一条白色长款连衣裙,真是温柔白月光,百搭不出错

教育要闻

10所低分可上的公办本科,2026艺考志愿的捡漏机会来了

艺术要闻

蒋中正3字题匾有错字,学书法,什么最重要?

旅游要闻

看北京|北海太平花盛放,红墙白蕊引客寻香

本地新闻

用云锦的方式,打开江苏南京

无障碍浏览 进入关怀版