人类基因组中绝大多数疾病易感变异都位于非编码区,这极大限制了致病基因与疾病作用机制的推断。近年来,随着高通量、广覆盖的蛋白质组学技术的不断发展,能同时靶向人血液中数千种蛋白质,并借助循环蛋白质将非编码变异与疾病相关机制建立关联。尽管已有蛋白质-基因组学研究在临床机制探索、药物靶点发掘上取得重要成果,但该领域仍存在局限:现有研究过度依赖顺式蛋白数量性状位点(pQTLs),忽略非编码变异对邻近及远端基因蛋白的多元调控效应;对诊断、预后相关蛋白标志物的多基因遗传架构认知仍不完善;缺乏跨人群的重复验证,研究结果稳定性与普适性不足,制约了临床应用转化。
近日,英国伦敦玛丽女王大学与德国柏林健康研究所 (BIH)的科研团队合作,开展迄今为止规模最大的蛋白质-基因组学关联研究。通过整合来自38个国际队列、78,664名参与者的数据,对1,161种血浆蛋白进行了全面的遗传调控分析,成功鉴定出超24,000个pQTL,其中顺式pQTL5,040个、反式pQTL19,698个。研究团队还借助机器学习方法对反式pQTL进行效应基因注释,揭示了N-糖基化等关键通路及特定细胞类型在调节循环蛋白质组中的核心作用;发现顺式与反式遗传调控在疾病关联中呈现显著异质性,识别了可作为药物靶点及药物效应标志物的蛋白,并挖掘类风湿关节炎等病症的潜在药物重利用价值。总之,该研究通过多队列荟萃分析构建了大规模人类蛋白质遗传调控图谱,为疾病机制解析、生物标志物开发与老药新用提供了重要依据。
![]()
研究团队基于38个队列、78,664名欧洲血统人群,对1,161个血液蛋白靶点开展蛋白质基因组学荟萃分析,经严格校正与精细定位,最终获得24,738个独立pQTL,其中5,040个为顺式pQTL,19,698个为反式pQTL。功能注释显示,顺式、反式pQTL中分别含有10.6%、10.4%的功能性变异,提示血浆蛋白质组广泛调控多源于致病基因产物扰动。大多数精细定位pQTL为高置信度位点(超80%),有278个顺式和4,013个反式pQTL为首次报道。
方差分析显示,整体上顺式pQTL对血浆蛋白水平变异的解释能力普遍高于反式 pQTL,但存在显著例外(如ICAM2、FUCA1的反式pQTL贡献远大于顺式)。261种蛋白的pQTL解释能力与多基因遗传力无线性关联,提示这类蛋白的pQTL挖掘已接近饱和。此外,蛋白结构特征与遗传调控显著相关,含二硫键、跨膜结构域的蛋白拥有更多pQTL,而基因约束性越高(pLI)pQTL数量显著较少。
![]()
图1. 荟萃分析中精细定位的pQTL
研究团队整合生物学先验知识与机器学习算法,为11,261个反式pQTL完成中等置信度以上的效应基因注释,其中1,534个为高置信度;约三分之二的位点指向单个致病基因。接下来,研究团队分析了反式调控涉及的通路、细胞类型与组织,包含431个蛋白靶点。通路富集分析显示,反式效应基因通路主要分为两类:一类是与顺式蛋白共享的通路(如LDL受体与胆固醇代谢通路),其循环蛋白水平受通路整体活性影响;另一类为蛋白水平远端系统性调控通路,以N-糖基化等翻译后修饰通路、血小板及血细胞生物学通路为主。其中,N-糖基化参与143 种蛋白靶点的分泌、折叠、半衰期及信号功能。
研究团队还分别鉴定出95 个、97个蛋白靶点,其反式效应基因在12种组织、29 种细胞类型中特异性高表达。组织与细胞富集分析表明,反式效应基因在肝脏(尤其是肝细胞)中最为富集,其次为免疫细胞(如NK细胞与IL-15)、内皮细胞、肺泡Ⅱ型细胞等;同一蛋白的反式效应基因还可同时富集于多种不同细胞类型,参与不同生物学过程,揭示跨器官、跨细胞通讯在蛋白质稳态中的重要作用。
![]()
图2. 反式pQTL的效应基因注释
研究团队发现,43.4%鉴定的独立pQTL与至少一种非蛋白质性状(如疾病易感性)相关,反式pQTL的多效性概率是顺式pQTL的4倍以上,凸显血浆蛋白遗传结构在疾病研究中的价值。根据关联蛋白与表型数量,这些多效性pQTL可分为分子多效性(影响多个蛋白)、表型多效性(影响多个疾病)及非特异性多效性三类。
在蛋白水平上具有多效性的533个pQTL中,有332个也显示出表型多效性,其效应基因在肝细胞中显著富集,主要通过蛋白复合物、配体-受体对及通路互作发挥作用。此外,研究团队还识别出285个已报道与非蛋白性状相关的pQTL,其关联蛋白显著富集多条通路。
![]()
图3. 分子多效性与表型多效性
由于具有更高的生物学先验性,顺式pQTL常被用于孟德尔随机化(MR)分析,以推断蛋白与疾病间的因果关系。研究团队将识别的顺式pQTL与FinnGen项目中的700多种疾病数据相整合,筛选出300个蛋白-疾病对,但仅73个得到MR和遗传共定位分析支持。对于其中115个蛋白-疾病对,研究团队利用反式pQTL进行独立性验证,发现有31个得到方向一致的因果推断,包含PCSK9与冠心病等已知血液药物靶点蛋白。
此外,研究团队也发现大量顺式与反式pQTL的MR结果存在显著异质性,部分反式pQTL证据不支持甚至完全相悖于顺式pQTL结论,如硬化蛋白SOST与骨折风险,顺式pQTL存在明确关联而反式pQTL分析效应趋近于零,这提示不同遗传调控模式可能对应不同疾病致病机制。
![]()
图4. 利用顺式和反式基因变异将蛋白质与疾病风险相关联
研究团队整合英国生物银行多达5.2万名受试者的血浆蛋白标志物研究结果,与涵盖超129.67万参与者的一项泛生物库开展系统性三角验证,涉及517种疾病。结果显示,193个高置信度遗传支持的蛋白-疾病对中,仅52个在生物标志物研究中方向一致,59个呈显著相反方向;仅44个蛋白-疾病对在遗传、前瞻性随访与现患病分析中结论一致,其中血浆弗林蛋白酶(furin)与高血压、心肌梗死和房颤持续相关,并揭示了该蛋白胞外致病作用,推翻传统胞内调控假说。
观察性研究与顺式pQTL遗传推断在蛋白-疾病关联上一致性偏低,为此研究团队探究了新鉴定反式pQTL的应用价值,发现在具备至少5个显著关联蛋白的的307种疾病中,超90%的疾病标志物特征可被170个多效性pQTL显著富集,其中139个为反式pQTL。特别地,反式pQTL也可助力药物重定位与生物标志物筛选。一个位于酪氨酸激酶2(TYK2)基因上的错义变异(rs34536443)被发现是一个影响6种蛋白质水平的反式pQTL,这些蛋白均与类风湿关节炎、银屑病、甲状腺功能减退风险呈正相关,且该位点的遗传信号与这几种疾病高度共定位。这为TYK2抑制剂用于类风湿关节炎的药物重定位提供遗传学证据,同时明确可作为治疗响应与预后监测的生物标志物。
![]()
图5. 反式QTL助力药物重定位与生物标志物筛选
综上所述,该研究构建了迄今规模最大、覆盖最全面的人类循环蛋白质遗传调控图谱,系统解析顺式与反式调控的生物学规律,并通过创新的计算方法解析了其潜在的效应基因、通路和细胞来源,揭示了如N-糖基化等系统性调控机制。通过对比顺式和反式遗传证据,强调了整合多种遗传证据对于准确理解蛋白生物学功能的必要性。这项研究不仅加深了人们对遗传信息如何转化为蛋白质功能并最终影响疾病的理解,也为精准医学和药物开发开辟了新的道路。
参考文献:
https://www.cell.com/cell/fulltext/S0092-8674(26)00385-5
01
02
03
04
05
快点亮"在看”吧!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.