“我们身体内绝大多数生命活动都直接或间接依赖于蛋白质。如果基因突变或表达异常,就会造成人体产生‘问题蛋白’,继而引发疾病。分子胶的独特之处在于,它像‘胶水’一样,能诱导细胞内的E3连接酶与‘问题蛋白’粘合。E3连接酶犹如‘质检员’,会给‘问题蛋白’贴上‘清除标签’,使其被机体识别并自动降解。”谈起分子胶,青岛海洋生物医药研究院(以下简称“海药院”)秦冲团队成员王霄向记者解释。
分子胶功效突出,但难点在于,分子胶作用机制依赖复杂的蛋白-蛋白相互作用,导致分子胶降解剂类药物的发现具有较大的偶然性,或者依赖于大通量筛选。正因如此,海药院科研团队通过系统整合研究数据,构建了全球首个分子胶数据库,并运用人工智能技术,与数据库中的新药候选分子深度“对话”,实现分子胶降解剂的理性设计与预测,从而有效推动了该领域新药发现的进程。
打破“数据孤岛”,提供一站式科研工具
面对“问题蛋白”,传统的小分子药物通常结合在目标蛋白的活性位点,像一把“钥匙”堵住锁眼,抑制其功能。但“问题蛋白”并未因此而消失,这就需要药物分子持续占据靶点,一旦抑制作用消失,“问题蛋白”就会很快恢复功能。近年来,以蛋白降解靶向嵌合体(PROTACs)和分子胶降解剂(MGDs)为代表的靶向蛋白质降解(TPD)技术,正在改变这一局面,它的目的不是“抑制”而是“清除”目标蛋白,已成为创新药物发现的前沿领域。
“与PROTACs相比,分子胶降解剂具有分子量更小、成药性更优等独特优势。近年来全球已有30余个分子胶进入临床试验,取得了瞩目的进展,展现出巨大应用潜力。”王霄表示。
分子胶领域的研究发展不是一蹴而就的。2007年是一个重要节点。当时华盛顿大学的研究团队发现,细胞内E3连接酶给“问题蛋白”贴上“清除标签”继而使其自动降解的过程,可以被一些小分子“劫持”,发挥诱导或增强的效果。正是因为这类小分子起到了“胶水”的作用,能够促进E3连接酶与“问题蛋白”粘合,导致后者被降解,该研究团队创造性地提出了“分子胶”的概念。2014年是又一个重要节点。随着科技的进步,科研团队在分子水平上解析分子胶与一种重要的E3连接酶的明确关键相互作用。这一发现极大推动了“靶向蛋白降解”这一前沿药物研究领域,进一步促进了分子胶领域研究发展。
“反映到分子胶的公开学术研究文献数量上,2001年有1篇,2007年又出现一篇,随后缓慢提高,2014年达到6篇,2024年开始进入爆发式发展阶段,数量达到60篇。2025年的数据还未完全统计,但会进一步提高。”王霄说。
尽管研究热度不断上升,但从数量上来说,全球分子胶数量并不算多。这是因为,多年来分子胶的发现与理性设计面临巨大挑战。分子胶作用机制依赖复杂的蛋白-蛋白相互作用,其发现往往依赖偶然发现或大规模筛选。系统整合研究数据,为分子胶的理性设计提供支撑,是该领域亟待解决的问题。
长期以来,分子胶领域的研究数据分散在各类文献、专利及数据库中,缺乏统一的整合平台,导致科研人员难以高效获取和利用信息。针对这一痛点,海药院科研团队针对分子胶领域长期存在的研究分散、数据标准不统一等痛点,打破“数据孤岛”,构建了全球首个分子胶数据库。
该数据库整合了2001年1月至2025年5月期间241篇学术研究文献,包含1840个条目、1629个独特分子胶、28个招募蛋白和94个靶点。数据库涵盖化学结构、结合亲和力、降解能力、生物活性、理化性质等,为靶向蛋白降解领域提供了一站式科研工具,可极大促进分子胶降解剂的理性设计与药物发现。
建立分子胶AI预测模型,快速预测生物活性
人工智能(AI)凭借其处理高维数据、识别复杂模式的能力,越来越成为药物发现的重要辅助工具。2025年,海药院主办人工智能与药物发现学术研讨会,深入探讨人工智能技术特点,探索人工智能技术在医药开发中的科学有效应用。这进一步彰显了其发力AI+制药的鲜明趋势。
AI+制药是指将机器学习、深度学习、自然语言处理和大数据等人工智能技术与传统制药环节相结合,通过从头生成、虚拟筛选和数据交叉比对等方式,提升新药研发效率的制药方式。现阶段,人工智能技术主要聚焦新药研发早期,在新药发现、降本增效等方面展现巨大潜力。
“我们建设全球首个分子胶数据库,就是为AI+制药提供基础数据支撑。”王霄说。他们建立了分子胶AI预测模型,并利用数据库中已统计的全球1000多个分子胶进行训练,通过从已知的“分子结构-生物活性”数据中学习规律,让模型能够快速预测新分子结构的生物活性,成为强大的预筛选和设计指导工具,节省大量实验成本和时间。
科研人员用一组数据举例。近年来,课题组自主构建了含500多个新型分子胶的化合物实体库,其中已有100多个被证实具有生物活性。基于这些数据建立的分子胶AI预测模型,在对新分子进行筛选时,能够在有限推荐的候选分子中显著富集潜在活性分子,其筛选效果明显高于随机筛选水平,体现出良好的实用性和工程价值。随着数据规模的不断扩大和算法的持续优化,该模型有望进一步提升筛选效率,为新药研发按下“加速键”。
由此来说,首个分子胶数据库的上线,不仅为全球科研人员提供了高效的研究工具,而且为药物研发的数字化转型奠定了基础。在该数据库之外,2025年,海药院还成功构建海洋天然产物EMNPD数据库I期,提取了数万个海洋来源化合物的标准化化学信息、生物活性数据及来源物种的生态信息。通过内置的机器学习接口,研究者可调用预训练模型进行类药性预测和虚拟筛选,为“蓝色药库”的系统性开发提供新一代数字基础设施。
当前,AI+制药日渐火热,而算力、算法、数据是驱动其进步的“三大支柱”。其中,数据是基本要素,谁能以更合规、更创新的方式建立高质量数据获取与治理能力,就能为构建更强大的算法(如生成模型)提供先机。2025年,海药院全球首个分子胶数据库、自主开发的海洋天然产物EMNPD数据库I期等2个数据库成功构建并实现应用,为新药发现架起人工智能接口。在浩如烟海的数据中,科研人员与候选分子深度“对话”,加快探索穿越千难万险的成药之路。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.