原文发表于《科技导报》2025 年第21 期 《 AI能否成为化学知识的发现者? 》
人工智能(AI)正推动科学研究范式由“加速器”向“发现者”转变。本文以中国科学技术大学“机器化学家”平台的实践为例,系统分析了AI在化学知识发现中的潜力与挑战,探讨了化学大模型、多模态数据融合及工业级智能实验室如何推动未来科研范式的系统性重塑。
1 为什么AI可以成为化学知识的发现者?
当前AI的快速发展为科学研究带来了深刻的范式变革。借助机器学习、知识图谱和智能自动化平台,科研人员正探索AI赋能的科学研究新路径。国家层面的政策驱动为这一变革提供了制度支撑:2023年科技部启动“AI for Science”专项,聚焦化学等基础学科;2025年国家自然科学基金持续加大对“AI+基础学科”交叉研究的支持。在此背景下,化学研究正加速迈向“人机协同、AI主导”的新范式。
在化学领域,面向化学的大模型成为新的研发热点。例如,上海人工智能实验室研发的 ChemLLM模型展示了高效处理复杂化学问题的能力。另外,在科学计算方向,大模型的理念也开始延伸到分子模拟与材料设计中。中国“深度建模”(DeepModeling)开源社区于2024年发起了OpenLAM计划,最终目标是能自行提出科学假设并完成模拟和实验设计。
中国科学技术大学江俊团队通过构建具有“感知—决策—执行—学习”闭环能力的“机器化学家”平台“小来”与“小临”,聚焦在在分子合成、催化筛选、材料设计等领域的研发。这一效率跃迁背后,AI正从数据处理工具向“知识合作者”进化,但它能否突破人类认知边界,成为独立的化学知识发现者?
首先,AI作为辅助工具,可以帮助研究人员识别变量之间的潜在关联性,并进一步挖掘其背后的知识结构,这是当前AI在科学领域最擅长的方向之一。在这个层面,AI通过对大规模实验或计算数据的学习,为后续的理论分析与机制探索提供切入点。AI虽然可以为人类科学家指明研究重点与潜在规律,但是后续仍需依赖科研人员基于领域知识进行物理图像或数学理论的构建与验证。
2 AI能否胜任知识发现者?
AI在化学领域尚未产生真正颠覆性的原创理论,其背后主要有3方面的原因。
2.1 高质量数据匮乏
高质量的数据匮乏是AI发展的主要瓶颈之一,尤其缺乏失败实验的数据,导致训练数据不完整并带有明显偏差。在化学大模型的构建中,常见的标签大多仍依赖人工完成,而前提则是拥有原始的、结构清晰的数据。现阶段AI尚未真正达到“集成人类智慧”的高度,其训练数据主要来源于已发表的成功案例,尤其集中在反应合成路径上。
此外,现有化学相关数据库尚未实现全面开放。这类数据库还普遍存在结构化不足的问题,难以满足模型深层理解与泛化的需求。化学数据的多模态融合也面临挑战:文本(文献)、图谱(分子结构)、光谱(NMR/IR)等数据异构性强。
2.2 人类认知维度受限
人类对科学规律的理解,主要依赖于2种形式:一是数学公式,二是可视化图像。但现实中,AI所学习到的规律往往位于高维特征空间。为了使这些高维规律为人类所理解,AI必须进行“降维处理”,但这种降维本身就会牺牲信息、扭曲原貌,仅保留可理解部分,并不能还原AI原本所掌握的全部知识结构。因此,推动AI与科学研究的融合,首要层次是人类要具备解析AI输出的能力,并通过数学建模等手段将其转化为可验证的科学表达。
2.3 实验验证效率低下
目前,AI提出的假设和预测大多需要通过传统实验手段进行验证,这种方法低效、耗时,一定程度上阻碍了AI科学假设的快速迭代和验证。因此,当下急需发展具有快速响应和智能执行能力的“行动智能”系统,与AI的设计能力相匹配。
3 AI知识发现的可靠性、数据基础与人机协同
3.1 AI发现的化学知识是否可靠?
深度模型往往基于大数据中隐含的统计相关性进行学习,而非建立在真实的因果推理基础上。基于可解释性算法的AI模型,能够从复杂实验数据中抽象出物理规律,建立具有预测能力的数学理论,为揭示科学机制、发现潜在法则提供了可行路径。这种方法不仅提升了模型的可信度与可控性,也有望推动AI从“辅助工具”向“知识发现者”角色的根本跃迁。
3.2 如何获取高质量的数据提升AI的智力?
针对化学数据稀缺、标注昂贵的问题,中国科学技术大学研究团队提出了“理论大数据+实验小数据”的融合策略:
一方面,通过高通量理论计算模拟生成大量数据用于模型预训练;
另一方面,再用少量真实的实验数据进行精调,有效提高模型的泛化能力与实际可用性。
在数据的可获取性方面,中国的数据政策更具开放性,为化学大模型提供更广泛的学习素材。此外,化学大模型通常面临多模态数据的融合挑战。2025年4月16日,上海人工智能实验室发布并开源了通用多模态大模型“书生·万象 3.0(InternVL3)”。该模型区别于传统“语言模型+视觉插件”的后融合方式,使模型具备原生处理多模态输入的能力。
3.3 人类如何适配AI快速发展的脚步?
随着科学体系的持续膨胀,人类个体已难以掌握所有知识的细节。AI与人类的协作应基于双重路径:
一方面,人类必须通过数学与理论工具提升自身解析AI输出的能力,建立可验证的科学体系;
另一方面,应合理接受知识封装机制,在必要时将AI模型作为可信赖的“黑箱工具”,从而将精力集中于更具创新性和突破性的科研任务。
4 AI重塑科研范式:基础设施、应用赛道与探索边界
4.1 工业级智能实验室将怎样重塑科研范式?
未来的实验室将迈向工业级智能体集群协作体系,实现设备、流程、数据的全面标准化与智能化。在这一愿景下,自动化合成单元、高通量表征平台、在线数据采集与分析系统将通过统一的操作系统与调度平台联接成“实验工厂”。在更大尺度上,多平台、多实验室通过云端互联形成“科研智能体网络”。研究人员从大量繁琐的重复性操作中解放出来,将更多时间投入到问题抽象、机理思考和结果解读之中,科研活动从“体力密集型”向“智力驱动型”彻底转变。
4.2 AI助力下,化学首先会在哪些赛道实现突破?
目前,AI在化学领域的典型应用包括分子设计、反应预测、催化剂筛选和合成路径规划等方向,并在多个研究环节取得了一系列具有突破性的成果。
从学科本身的发展逻辑出发,理论化学可能是最先全面受益于AI加持的领域。其次,配方筛选类问题也是AI较容易突破的方向,催化化学和合成化学是2个典型受益方向。在实际应用与商业化方面,药物合成化学是当前AI最具产业潜力的方向之一,尤其是与蛋白质功能相关的研究领域。总体来看,与理论建模联系紧密、结构变量有限的化学子领域,在当前AI发展的阶段更容易取得实际突破。
4.3 科学探索的“偶然之美”还能出现吗?
人工智能的现阶段能力,应该更多聚焦于“立地”的方向,即将既有理论和知识体系转化为可落地、可应用的科研成果。只有当AI拥有足够“理解世界”的能力时,科学研究才可能从“实验验证”迈向“理论自洽与直接预测”的全新范式。
5 AI时代的化学人才与科研角色重构
5.1 AI时代,化学创新人才的成长路径何在?
在授业和解惑方面,AI的能力在许多情境下已展现出明显优势。AI或许能发现上千个可行的公式与路径,但真正具备判断力的,仍是人类自身。在AI辅助科研日趋普遍的背景下,未来的研究人员将愈发“原子化”——每个人的研究风格、学术趣味和问题选择将变得更加多元和个性化。
5.2 AI进入科学领域,会否让研究生失业,甚至让科学家无事可做?
AI进入科学领域所催生的“智能科学家”,其使命从来不是取代人类,而是赋能并增强科学家的能力。对于化学领域的青年研究者而言,更重要的不是“是否会被AI取代”,而是“如何与AI共同成长”,让自己成为那个能驾驭智能工具、引导科研方向的人。
6 结语
人工智能正在深刻重塑化学研究范式。在新材料、新能源、生物医药等前沿领域,AI正成为驱动原创性突破的关键引擎。然而,这一变革仍处于早期阶段,其进一步发展面临很多挑战。AI不应被神化或简化,而应与人类智能协同互补。二者融合,将成为推动科学跃迁的重要力量。
本文作者:江俊、崔乘幸、黄文光
作者简介:江俊,中国科学技术大学精准智能化学全国重点实验室,化学与材料科学学院,河南省科学院智慧创制研究所,教授,研究方向为计算化学和人工智能化学。
文章来 源 : 江俊, 崔乘幸, 黄文光. AI能否成为化学知识的发现者?[J]. 科技导报, 2025, 43(21): 16−22 .
本文有删改,
内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」
《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的研究成果、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、科技新闻、科技评论、专稿专题、综述、论文、政策建议、科技人文等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.