网易首页 > 网易号 > 正文 申请入驻

将材料数据转化为人工智能实验室助理

0
分享至

随着科学文献量的持续增长,研究人员正在转向人工智能来筛选数百万篇研究论文,并发现可以加速新材料发现的见解。


在美国能源部阿贡国家实验室超级计算机的支持下,剑桥大学的Jacqueline Cole和她的团队正在开发人工智能工具,自动挖掘科学期刊文章以构建结构化材料数据库。然后,这些数据集用于训练专门的语言模型,以简化材料研究。

“我们的目标是给你的实验室里配备一个类似数字助理的东西。”Cole说,她是剑桥大学皇家工程研究院材料物理学教授,也是分子工程系主任。“一种通过回答问题和提供反馈来帮助指导实验和指导研究的工具,是对科学家的补充。”

Cole在阿贡领导力计算设施(ALCF)的工作始于近十年前。2016年,她获得了ALCF数据科学计划的首批项目之一,该计划扩大了该设施对模拟、数据科学和机器学习交叉领域工作负载的支持。目前已完成的项目帮助发展了使用ALCF资源进行人工智能驱动科学的研究人员社区,并扩大了员工的专业知识和能力,以支持这一新兴领域。


“她的团队是最早使用ALCF计算资源将机器学习与模拟和实验结果相结合以推进数据驱动材料研究的团队之一,”ALCF人工智能和机器学习团队负责人Venkat Vishwanath说。“从开发ChemDataExtractor文本挖掘工具到根据研究论文构建自动化数据库,他们的工作为加速材料设计和发现开辟了新的途径。”

为了表彰该团队的创新工作,Cole和合作者最近凭借他们的论文“从设计到设备的方法提供全色共敏化太阳能电池”获得了英国皇家化学学会2025年材料化学地平线奖。在这项研究的基础上,Cole继续使用ALCF超级计算机开发人工智能工具,旨在加快寻找用于能源应用、光基技术和机械工程的新材料。

Cole最近的工作重点是开发更小、更快、更高效的人工智能模型来支持材料研究,而不需要从头开始训练大型语言模型(LLM),这通常需要的大量计算成本。

LLM是设计用于处理和生成人类语言的AI模型。构建LLM首先在大型数据集(如文本语料库)上进行预训练,以帮助模型学习通用语言模式。这个过程通常需要大量的计算能力。一旦模型经过训练,研究人员就会使用更小、更有针对性的数据集对其进行微调,以确保它提供准确和相关的答案。


为了绕过昂贵的预训练过程,Cole及其同事开发了一种从特定领域的材料数据生成大型、高质量问答(Q&A)数据集的方法。他们使用新的算法和ChemDataExtractor工具,将光伏材料数据库转换为数十万个问答对。这个过程被称为知识蒸馏,以现成的人工智能模型可以轻松摄取的形式捕获详细的材料信息。

Cole说:“重要的是,这种方法可以减轻语言模型本身的知识负担。” “而不是依赖模型了解一切,我们以问答的形式让它直接获得精心策划、结构化的知识。这意味着我们可以完全跳过预训练,仍然可以实现特定领域的实用性。”

Cole的团队使用问答对来微调较小的语言模型,这些模型继续匹配或优于在一般文本上训练的更大的模型,在特定领域的任务中实现了高达20%的准确率。虽然他们的研究集中在太阳能电池材料上,但这种方法可以广泛应用于其他研究领域。

除了这项工作,该团队还进行了相关研究,以开发针对材料科学特定领域的语言模型。在一篇论文中,Cole的团队为航空航天和汽车等机械工程领域常用的材料建立了一个庞大的应力-应变特性数据库。研究人员还开发了MechBERT,这是一种经过训练的语言模型,可以回答有关应力-应变特性的问题,在预测应力下的材料行为方面优于标准工具。


在最近的另一项研究中,该团队展示了如何在不牺牲性能的情况下,使用比传统训练方法少80%的计算能力来适应光电子学的语言模型。

这些努力,以及Cole团队在过去十年中在ALCF的支持下发表的许多研究,共同说明了人工智能是如何改变材料科学研究的。随着最近对问答数据集的关注,该团队正在使人工智能模型更容易被更广泛的社区使用,为人工智能工具铺平道路,这些工具可以为实验人员提供更精确和相关的支持。

Cole说:“也许一个团队在凌晨3点在光源设施进行了一项激烈的实验,发生了意想不到的事情。”“他们需要一个快速的答案,没有时间筛选所有的科学文献。如果他们有一个在相关材料上训练过的特定领域的语言模型,他们可以提出问题来帮助解释数据,调整设置,并使实验保持正轨。”


最终,Cole认为这种方法可以帮助材料科学中的人工智能进一步普惠化。 “你不需要成为语言模型专家,”她说。 “你可以采用现成的语言模型,只需几个GPU,甚至你自己的个人电脑,就可以针对你的特定材料领域对其进行微调。这更像是一种即插即用的方法,使使用人工智能的过程更加高效。”

通过在ALCF强大的超级计算机上进行繁重的工作,Cole的团队正在推进更有针对性和用户友好的人工智能工具的开发,帮助材料科学家跟上不断增长的文献量,设计更好的实验,更快地发现。

与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
社会运行逻辑:穷人不生孩子,富人的阶层就会倒退

社会运行逻辑:穷人不生孩子,富人的阶层就会倒退

舒山有鹿
2026-01-19 09:02:09
发现没?凡是男人带女人出去玩,女的都会穿裙子,你知道为什么吗

发现没?凡是男人带女人出去玩,女的都会穿裙子,你知道为什么吗

老好人的愤怒
2026-01-15 18:52:47
广州白云山一徒步者踩中捕兽夹,景区回应:正在排查

广州白云山一徒步者踩中捕兽夹,景区回应:正在排查

上游新闻
2026-01-19 14:04:14
试过贾府一半男子的多姑娘,为何在试贾宝玉时,成了“灯姑娘”?

试过贾府一半男子的多姑娘,为何在试贾宝玉时,成了“灯姑娘”?

铭记历史呀
2026-01-15 14:24:03
西安代驾圈,挤满了失业的经理人 | 人间

西安代驾圈,挤满了失业的经理人 | 人间

网易人间
2026-01-19 14:04:31
网友调侃最快护士该请马俊仁执教,张水华呆萌反问:马俊仁是谁?

网友调侃最快护士该请马俊仁执教,张水华呆萌反问:马俊仁是谁?

杨华评论
2026-01-19 00:45:03
越南谅山一名中国老板摊上事了!仓库遭突击,搜出大量产品,被定义为走私军火

越南谅山一名中国老板摊上事了!仓库遭突击,搜出大量产品,被定义为走私军火

越南语学习平台
2026-01-18 10:17:16
孙守刚卸任河南省政府副省长职务

孙守刚卸任河南省政府副省长职务

澎湃新闻
2026-01-19 13:42:37
韩媒:预计今年中国赴韩邮轮航次较去年激增21倍,韩国港口全力保障

韩媒:预计今年中国赴韩邮轮航次较去年激增21倍,韩国港口全力保障

环球网资讯
2026-01-20 06:43:24
57岁江珊现状让人心酸,脸垮嘴斜,满头白发,一代女神像老太太

57岁江珊现状让人心酸,脸垮嘴斜,满头白发,一代女神像老太太

一娱三分地
2025-11-29 22:10:18
NBA全明星首发:东契奇总票王,字母哥东部票王,老詹无缘

NBA全明星首发:东契奇总票王,字母哥东部票王,老詹无缘

十三哥侃大山
2026-01-20 05:57:06
曾经他们硬气的拒绝了中国,如今好怀念他们当初桀骜不驯的样子!

曾经他们硬气的拒绝了中国,如今好怀念他们当初桀骜不驯的样子!

北纬的咖啡豆
2025-12-23 14:28:08
折扣破纪录!中国正以极低的价格抢购俄罗斯石油

折扣破纪录!中国正以极低的价格抢购俄罗斯石油

老马拉车莫少装
2026-01-19 21:10:32
陶玉玲追悼会,女儿忍痛操办后事,遗像不同寻常,李明启哭成泪人

陶玉玲追悼会,女儿忍痛操办后事,遗像不同寻常,李明启哭成泪人

叨唠
2026-01-20 06:00:10
全球首次!中国用电量破10万亿

全球首次!中国用电量破10万亿

21世纪经济报道
2026-01-19 12:53:17
远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

晓艾故事汇
2025-01-09 22:01:49
当初为什么去曼城而不是国米?热苏斯:我需要在瓜帅手下踢球

当初为什么去曼城而不是国米?热苏斯:我需要在瓜帅手下踢球

懂球帝
2026-01-20 05:37:07
罗马诺:曼联将召开会议讨论冬窗引援事宜,卡里克将参与其中;卡里克非常信任梅努,不会在1月份让他离队

罗马诺:曼联将召开会议讨论冬窗引援事宜,卡里克将参与其中;卡里克非常信任梅努,不会在1月份让他离队

MUREDS
2026-01-20 00:03:21
江苏嫣然分院续!老板自己也很难,被工程套住,只能免费提供场地

江苏嫣然分院续!老板自己也很难,被工程套住,只能免费提供场地

鋭娱之乐
2026-01-19 08:57:40
挑衅ICE特工、煽动妻子开车撞……司法部正在调查TA

挑衅ICE特工、煽动妻子开车撞……司法部正在调查TA

大洛杉矶LA
2026-01-20 04:37:12
2026-01-20 07:27:00
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1628文章数 510关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

本地
旅游
艺术
房产
公开课

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

旅游要闻

别只盯着二月!南京梅花山早梅抢先登场,实拍画面每一帧都美哭

艺术要闻

瑞典艺术大师,佐恩人物作品精选19幅

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版