研究背景
在材料科学领域,数据驱动方法已成功应用于结构明确的硬材料的发现和预测。粘附水凝胶作为一类重要的软材料,在高端应用中需求广泛。
关键问题
然而,数据驱动软材料的设计主要存在以下问题:
1、软材料的设计极具挑战性
凝胶和弹性体等软材料的复杂多尺度结构-性能关系以及弱分子相互作用和热波动的影响,使得开发准确的预测理论或计算模型变得困难,材料发现往往依赖于反复的实验试错。
2、粘附水凝胶的水下粘附性能受限
尽管粘附水凝胶应用前景广阔,但实现即时、牢固且可重复的水下粘附仍是一个长期挑战。现有研究中单体类型多样,难以形成一致的数据集或简单的设计原则来优化性能。将生物学洞察(如粘附蛋白)转化为合成策略并实现机器学习的外推预测,仍然是端到端设计模型的主要难题。
新思路
有鉴于此,北海道大学龚剑萍、范海龙、Wei Li、Ichigaku Takigawa等人提出了一种数据驱动的方法,集成了数据挖掘、实验和机器学习,从头开始设计高性能的粘附水凝胶,以适应苛刻的水下环境。通过利用蛋白质数据库,开发了一种描述符策略,通过理想的随机共聚在聚合物链中统计复制蛋白质序列模式,从而实现了有针对性的水凝胶设计和数据集构建。利用机器学习,从180个仿生水凝胶的初始数据集中优化了水凝胶配方,实现了粘附强度的显著提高,最大值超过1 MPa。这些超粘合水凝胶在从生物医学工程到深海探测等不同的应用中具有巨大的潜力,标志着软材料在数据驱动创新方面的显著进步。
技术方案:
1、提出了一种全新的数据驱动方法
本研究提出新数据驱动方法,通过整合数据挖掘、实验验证和机器学习,成功设计出高性能水下粘附水凝胶,助力多领域应用。
2、详述了数据挖掘过程
作者从NCBI数据库提取24,707个粘附蛋白数据,分析前200个物种,通过多序列比对和氨基酸分类,设计出180种水凝胶配方。
3、阐述了180种数据挖掘驱动水凝胶的合成过程
作者合成180种水凝胶,通过1H NMR确认竞聚率,蒙特卡洛模拟验证序列特征,16种水凝胶表现出强大粘附力,证明数据驱动方法有效。
4、展示了如何利用机器学习进一步提高水凝胶的粘附强度
作者利用机器学习优化水凝胶粘附强度,通过高斯过程和随机森林回归模型,结合序贯优化,发现BA、PEA和ATAC协同作用可显著增强粘附性。
5、评估了性能最佳的ML驱动水凝胶与最佳DM驱动水凝胶的性能
结果表明。ML驱动水凝胶(R1-max)性能优于DM驱动水凝胶(G-max),在多种基材上展现高粘附性、耐久性和生物相容性,适用于恶劣环境。
技术优势:
1、首次提出并实施了一个端到端设计框架
作者首次提出并实施了一个整合数据挖掘、实验验证和机器学习迭代优化的端到端设计框架,成功解决了软材料复杂结构-性能关系带来的设计难题。通过从生物粘附蛋白中提取序列特征并结合机器学习模型优化,实现了高性能水凝胶的从头设计,使得水凝胶的粘附强度达到了超过1 MPa的“超级粘附”水平。
2、成功设计并合成了超粘附水凝胶
通过统计复制生物粘附蛋白的特征序列,成功指导了合成水凝胶的设计,并明确了特定单体组合对水下粘附性能的关键贡献。所开发的超粘附水凝胶不仅在严苛的水下环境(如深海、高压水泄漏)中表现卓越,而且具有良好的生物相容性。
技术细节
数据驱动的超粘附水凝胶从头设计
研究提出了一种全新的数据驱动方法,巧妙地整合了数据挖掘(DM)、实验验证和机器学习(ML),旨在实现高性能水下粘附水凝胶的从头设计。首先,通过挖掘蛋白质数据库,作者开发了一种描述符策略,以统计学方式在聚合物链中复制蛋白质序列模式,从而指导了水凝胶的设计并构建了初始数据集。随后,利用机器学习对由180种生物启发水凝胶组成的初始数据集进行了优化,最终使得水凝胶的粘附强度取得了显著突破,最高值超过1 MPa。这种超粘附水凝胶在生物医学工程和深海探索等多样化应用中具有巨大潜力,标志着软材料数据驱动创新的一项重要进展。
![]()
图 水下粘性水凝胶的数据驱动从头设计
粘附蛋白的数据挖掘
作者详述了数据挖掘过程。从NCBI蛋白质数据库中编译了包含24,707个粘附蛋白的数据集,并选择了前200个物种进行分析,以识别最具代表性的蛋白质序列并最小化个体差异的影响。使用Clustal Omega工具进行多序列比对以确定每个物种的共有序列。为降低变量维度,将20种标准氨基酸根据其理化性质分为六类:疏水、亲核、酸性、阳离子、酰胺和芳香族。统计分析显示,粘附蛋白的序列即使在粗粒度的功能类别水平上也表现出显著的序列异质性,并且不同物种之间在这些功能类别的成对频率上存在独特模式,暗示着潜在的顺序性。基于这些见解,作者设计了一种水凝胶策略,使用六种功能单体来代表六种功能类别的氨基酸,并通过统计复制功能类别的序列特征,最终得到了180种独特配方用于水凝胶合成。
![]()
图 粘附蛋白的DM和制剂设计
DM驱动水凝胶的合成
作者选取了六种功能单体,每种代表一种氨基酸的功能类别,并通过1H NMR分析确认了它们在DMSO中共聚时的近乎统一的竞聚率,这表明聚合过程中组分漂移极小。基于这些实验确定的竞聚率和推导出的单体比例,蒙特卡洛模拟验证了所得异聚物的单体嵌段长度和成对频率分布与粘附蛋白的观察结果高度匹配。按照推导出的配方,通过一锅法自由基共聚合成了180种DM驱动凝胶,并通过触针测试评估了其水下粘附强度。值得注意的是,其中16种水凝胶表现出强大的粘附力(Fa > 100 kPa),G-042达到了最高的147 kPa,这充分证明了数据驱动方法在指导粘附水凝胶从头设计方面的有效性。通过与非理想共聚(在DMS中进行)的G-004变体进行比较,结果显示统计序列(在DMSO中合成)的变体表现出明显更高的Fa,强调了理想随机共聚在实现模仿蛋白质功能所需的统计序列特征方面的重要性。
![]()
图 用于水下粘附的DM驱动水凝胶
通过机器学习优化水凝胶
作者从180个水凝胶数据集中开始,评估了九种机器学习模型,最终确定高斯过程(GP)和随机森林回归(RFR)是预测Fa的最有效基础模型。基于这些模型,实施了序贯模型优化(SMBO)工作流,并以期望改进(EI)作为采集函数,以分批次的方式提出新的水凝胶配方,从而减少了实验轮次。验证结果显示,所有SMBO方法都实现了比训练数据更高的Fa,其中RFR-GP表现最佳,取得了最高的Fa。通过SHAP分析,发现高含量的BA和PEA单体能显著提高Fa,而HEA、CBEA和AAm则倾向于降低Fa。ATAC则表现出双重效应,适度含量至关重要。这些发现为设计强水下粘附水凝胶提供了明确的设计原则:结合BA、PEA和ATAC是关键,它们协同利用疏水效应和静电相互作用来增强水下粘附性。
![]()
图 水下粘合剂水凝胶的ML优化
超粘附水凝胶的性能
与G-max相比,ML驱动水凝胶在盐水中平衡后表现出更高的疏水性BA和芳香族PEA含量,导致不透明度增加、粘弹性和模量增强,这表明共聚物链在水介质中形成了更强的关联,从而促进了能量耗散并提升了机械强度。R1-max在玻璃上达到了超过1 MPa的最高Fa,并在200次附着-脱离循环中保持了稳定的粘附性。它还对多种基材表现出强粘附力,包括无机材料、塑料和金属,并通过剪切和剥离测试得到证实。值得注意的是,R1-max能够使不同材料的板在1公斤剪切载荷下维持连接超过1年,展现出卓越的耐久性。在不同水溶液中,粘附性能略有差异,体现了生物系统中“适应性而非普遍优化”的原则。研究还通过实际案例展示了其应用潜力,例如将橡胶鸭固定在海边岩石上和密封高压水泄漏的管道,突显了其在恶劣环境下的适用性。这些水凝胶也表现出良好的生物相容性。
![]()
图 通过DM和ML优化鉴定的水凝胶的表征和性能
展望
总之,本文引入了一种数据驱动的方法,该方法集成了从蛋白质中提取有价值的序列信息,可扩展的聚合物合成和迭代ML,以解决软材料从头设计和开发中的长期挑战。除了粘合剂水凝胶,这种数据驱动的设计框架为开发各种功能软材料提供了系统的,可扩展的端到端方法。然而,挑战仍然存在,主要是由于单体多样性、控制单体序列到适合材料开发的规模的聚合物合成技术和数据集的可扩展性等方面的限制,克服这些挑战将需要扩展模块化单体库、推进聚合技术,并开发可在稀疏、多尺度数据集上推广的物理学ML模型。
参考文献:
Liao, H., Hu, S., Yang, H. et al. Data-driven de novo design of super-adhesive hydrogels. Nature 644, 89–95 (2025).
https://doi.org/10.1038/s41586-025-09269-4
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.