引言
蛋白质之间的相互作用(Protein-Protein Interactions, PPIs)构成了生命活动的基石。然而,作为观察者和干预者,我们长期面临一个困惑:为何有些蛋白质表面极易成药,而另一些则如磐石般沉默?这种“不可成药”(Undruggable)的特性究竟是偶然还是进化的必然?
为了回答这一触及药物研发灵魂的问题,研究团队构建了一个合成进化的“平行宇宙”,强迫蛋白质在从未发生过相互作用的表面上“相亲”。这项发表于2月12日的《Science》(“Structural ontogeny of protein-protein interactions”)的研究,为我们要揭示了蛋白质相互作用从无到有的结构发生过程,并提出了一个令人深思的观点:那些沉默的表面,或许是进化刻意为之的“反选择”结果。![]()
有些蛋白质表面极其“好客”,很容易找到结合伴侣,也容易被药物分子靶向;而另一些表面则如磐石般沉默,被称为“不可成药”(Undruggable)区域。这种差异究竟是偶然的,还是进化的必然?是因为我们尚未找到合适的钥匙,还是锁芯本身就拒绝被打开?
蛋白质社交圈的“贫富差距”
在结构生物学的视角下,蛋白质并非均匀的球体,而是充满了沟壑、凸起和口袋的复杂三维实体。长期以来,药物研发人员发现了一个明显的“马太效应”:天然的蛋白质结合位点(Natural Binding Sites)往往也是最容易成药的位点。这些区域似乎天生就具有某种吸引力,无论是通过噬菌体展示筛选出的多肽,还是合成抗体库,甚至小分子药物,都倾向于结合在这些特定的位置。
相反,蛋白质表面的其他区域,那些在进化史上没有结合配体记录的“沉默表面”(Silent Surfaces),则表现出极端的冷漠。尽管研究人员尝试了各种手段,针对这些区域设计高亲和力、高特异性的结合分子仍然极其困难。这构成了现代药物研发中最大的挑战之一:许多与疾病密切相关的靶点(如转录因子、Ras蛋白等)因为缺乏经典的结合口袋,长期被视为不可成药。
这引发了一个根本性的生物物理学疑问:进化的结合表面与非结合表面之间,是否存在本质的物理化学差异?天然结合位点之所以容易结合,是因为它们拥有独特的疏水性或几何形状吗?还是因为它们经历过亿万年的进化打磨,形成了一种特殊的能量状态?为了探究这一问题的本质,该研究团队并没有选择分析现有的天然复合物,因为那只能告诉我们要结果,无法通过回溯看到过程。他们选择了一条更具挑战性的道路:人工模拟蛋白质相互作用的起源(Ontogeny)。
构建进化的“平行宇宙”
研究团队选择了一个经典的蛋白质模型系统:Z结构域(Protein Z-domain)。这是一种来源于葡萄球菌A蛋白的工程化支架蛋白,拥有极高的稳定性。在自然界和以往的工程改造中,Z结构域通常通过其螺旋1和螺旋2(H1-H2)组成的表面与抗体Fc段或其他靶标(如亲和体Affibody)结合。这个H1-H2表面就是所谓的“天然结合表面”。
为了制造对比,研究人员设计了一个巧妙的实验方案:他们封锁了Z结构域的天然结合表面,转而关注其“背面”和“侧面”——即螺旋2与螺旋3(H2-H3)以及螺旋1与螺旋3(H1-H3)组成的表面。这些表面在进化史上从未被用来进行分子识别,是名副其实的“处女地”。
研究人员构建了一个庞大的“库对库”(Library-on-Library)筛选系统。他们不仅突变了蛋白质A(Z-A)的非天然表面,同时也突变了蛋白质B(Z-B)的非天然表面。具体来说,他们在Z-A选择了5个位点,在Z-B选择了6个位点,将这些位置的氨基酸替换为5种疏水性氨基酸(甲硫氨酸Met、苯丙氨酸Phe、亮氨酸Leu、异亮氨酸Ile、缬氨酸Val)。
这里的数字值得关注:通过限制氨基酸种类为疏水性,研究人员虽然缩小了化学空间,但理论上的序列多样性仍然高达 3.63 × 108。在实际的酵母展示文库中,功能性库的容量达到了 2.50 × 109,这足以覆盖绝大多数可能的组合。
这是一场精心设计的“强行配对”。两个原本陌生的表面,在数轮这种高强度的筛选压力下,被迫寻找彼此的契合点。研究人员利用下一代测序技术(NGS)追踪了每一轮筛选中数百万个序列的演变,如同在显微镜下观察一个微缩的进化过程。
从混乱到秩序:棘轮般的结构适应
实验结果令人惊讶。经过五轮筛选,流式细胞术的数据显示,原本不相互作用的Z-A和Z-B文库开始出现明显的结合信号。在裂解捕获实验(Cleavage-capture assay)中,保留的荧光信号证明了高亲和力复合物的形成。但真正的秘密隐藏在结构之中。研究人员成功解析了6个不同簇(Cluster)的共进化复合物的晶体结构,分辨率在1.43到2.85埃之间。当他们将这些结构与天然的Z结构域-亲和体复合物进行对比时,一幅截然不同的画面展现在眼前。
天然的结合界面往往表现出一种高度保守的对接模式。无论如何突变天然界面上的氨基酸,复合物的整体结合角度和取向通常保持不变,就像一把钥匙插入锁孔,虽然齿痕可以微调,但插入的方向是固定的。
然而,在这些全新进化的合成界面中,情况完全不同。研究人员发现,不同的序列簇虽然都结合在预设的非天然表面区域,但它们的对接取向(Docking Orientations)表现出了极大的可塑性。以Z-B的螺旋3为参考,不同簇之间的对接角度变化高达 91.1°。这就像两只手试图紧握,但并不是标准的握手姿势,而是以各种扭曲、旋转的角度尝试扣在一起。
这种结构上的多样性被称为“棘轮状”(Ratchet-like)结合模式。合成复合物就像是在不断尝试不同的角度,试图找到一个能量上的落脚点。这种现象在天然界面中极为罕见。天然界面似乎已经被进化“锁定”在一个深邃的能量井中,而合成界面则像是在一个布满浅坑的平原上滚动,掉进哪个坑取决于最初的几个关键突变。
能量景观:深井与浅滩的物理学隐喻
为了更深入地理解这种差异,研究人员利用机器学习模型(Selection Probabilistic Model, SPM)重建了这些蛋白质相互作用的适应度景观(Fitness Landscape)。这是一种将序列空间映射到能量状态的数学模型,能够让我们看到进化过程中的“地形图”。
数据揭示了天然表面与沉默表面之间最本质的物理差异。对于天然的Z结构域结合界面,能量景观由一个巨大的、深邃的能量井(Deep Energy Well)主导。所有的高亲和力序列最终都汇聚到这个井底。这意味着,一旦蛋白质踏入这个结合区域,进化的引力会将它无可避免地拉向一个最优的结合构象。实验测定的解离常数(Kd)支持了这一点,天然界面的最优结合体Kd值可低至 2.4 nM。更重要的是,这个深井与周围的浅井之间存在巨大的能量间隙(Energy Gap),估算至少为 4.7 kcal/mol。这意味着,除了这个最优解,其他结合模式在能量上都是极不稳定的。
相比之下,合成界面的能量景观则呈现出一种“锯齿状”(Sawtooth)的特征。它没有一个单一的主导深井,而是布满了许多深度相当的浅井(Shallow Energy Wells)。每个簇代表了一个独立的浅井。实验测得的这些合成复合物的Kd值分布在 0.4 到 8.8 µM 之间,虽然对于从头设计的蛋白来说已经相当不错,但相比天然界面仍有数量级的差距。更关键的是,这些浅井之间的能量差异很小,大约只有 1.8 kcal/mol。
这解释了为什么合成界面会表现出如此多样的结合模式。因为缺乏一个绝对优势的深井,进化过程可以在多个平行的路径上探索,最终陷入不同的局部极小值。这也解释了为什么针对非天然表面的药物设计如此困难:你不是在寻找通往唯一宝藏的地图,而是在一片充满迷雾的沼泽中寻找任何可以立足的硬地。
“种子”接触:互作发生的阿基米德支点
在这些合成界面从无到有的过程中,是什么启动了最初的结合?研究人员通过对进化轨迹的计算模拟和上位性(Epistasis)分析,捕捉到了相互作用发生的最初瞬间。上位性是指一个位点的突变效应依赖于另一个位点突变的现象。在蛋白质相互作用中,这意味着两个残基必须同时突变才能产生结合力。研究发现,在合成进化的早期阶段,分子间的上位性(Inter-chain Epistasis)起到了决定性作用。
具体的分析揭示了所谓的“种子”序列(Seed Sequences)。例如,在通往簇A7B3的进化路径上,研究人员鉴定出了一对关键的相互作用:Z-A链上的第45位苯丙氨酸(F45A)和Z-B链上的第33位苯丙氨酸(F33B)。这对残基在结构核心形成了紧密的疏水堆积。模拟显示,这对“种子”接触是早期结合的关键锚点。一旦这个锚点建立,其他的突变就像围绕这个支点旋转一样,逐渐优化结合界面。
有趣的是,天然界面和合成界面在接触模式上也表现出显著差异。研究人员定义了一个指标:接触比率(Contacts Ratio),即“文库-文库”接触数(LL)与“文库-骨架”接触数(LF)的比值。合成界面的平均接触比率为 0.61,显著高于天然界面的 0.22(LL1库)和 0.33(LL2库)。
这意味着,在从零开始构建相互作用时,蛋白质高度依赖于那些高度可变的文库残基之间的直接相互作用(LL)来建立联系。而天然界面由于已经存在一个优化的骨架形状,更多地利用文库残基与固有的骨架残基(LF)之间的相互作用来微调结合。合成复合物就像是两个完全依靠彼此新长出的手(文库残基)紧紧抓住对方,而天然复合物则更像是把手(文库残基)伸进对方原本就有的口袋(骨架)里。
进化的“反选择”:沉默并非偶然
这项研究最引人深思的结论在于对“不可成药性”的进化解释。
为什么天然表面拥有深邃的能量井,而合成表面只有浅滩?研究人员推测,这并非物理化学的随机结果,而是进化压力的体现。在细胞拥挤的环境中,蛋白质必须避免非特异性的聚集。因此,对于那些不需要行使结合功能的表面,进化可能施加了一种“反选择”(Counter-selection)压力,也就是主动清除那些可能导致高亲和力结合的特征(如深口袋或特定的疏水斑块)。
这种反选择导致了非结合表面在能量图景上被“烫平”了。它们被设计成排斥结合,以保持细胞内的秩序。因此,当我们试图针对这些表面开发药物或设计结合蛋白时,我们实际上是在对抗亿万年来进化所建立的防御机制。
实验中合成界面的Kd值停留在微摩尔(µM)级别,似乎暗示了这种非天然表面的能量极限。在没有预先存在的结构互补性的情况下,仅靠疏水作用的堆积,很难达到纳摩尔(nM)级别的结合亲和力。那些天然的高亲和力界面,是漫长进化岁月中偶然获得的结构恩赐,并被自然选择精心保留和深挖的结果。
结语
这项发表于 Science 的研究,通过一个精巧的合成进化实验,为我们揭示了蛋白质相互作用的结构发生学。蛋白质表面的“沉默”不是一种被动的缺席,而是一种主动的拒绝。天然的结合位点是深邃的峡谷,引导着分子流向特定的结合模式;而非天然表面则是崎岖的荒原,充满了浅坑和歧路。
对于药物研发人员而言,这既是一个坏消息,也是一个好消息。坏消息是,“不可成药”靶点的确存在物理和进化上的本质障碍,我们不能指望简单地套用针对天然位点的筛选策略就能成功。好消息是,我们开始理解这种障碍的本质了。通过识别那些关键的“种子”残基,利用棘轮效应探索多样的结合模式,甚至通过计算设计去“挖掘”人工的能量井,我们或许终将找到打破沉默的钥匙。在这个微观的相亲实验中,我们看到的不仅仅是分子的结合,更是生命在秩序与混乱之间通过几十亿年博弈所划定的边界。而科学的任务,就是不断试探并最终跨越这些边界。
参考文献
Yang A, Jiang H, Jude KM, Akpinaroglu D, Allenspach S, Li AJ, Bowden J, Perez CP, Liu L, Huang PS, Kortemme T, Listgarten J, Garcia KC. Structural ontogeny of protein-protein interactions. Science. 2026 Feb 12;391(6786):eadx6931. doi: 10.1126/science.adx6931. Epub 2026 Feb 12. PMID: 41678610; PMCID: PMC12904254.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.