![]()
探索宇宙奥秘 · 理性思考
基因组注释长期依赖序列同源性比对。科学家通过比对蛋白质一级结构(氨基酸序列)的相似性,推测未知蛋白的功能归属。这种方法在亲缘关系较近的物种间行之有效,却存在一个致命盲区:当蛋白质在漫长演化中积累足够多突变,其氨基酸序列可能已面目全非,但三维结构却保持高度保守。
黑腹果蝇(Drosophila melanogaster)基因组中的2000多个"暗物质"基因正是这一困境的典型。它们并非真的"黑暗",而是序列分化程度超出了传统检索算法的识别阈值。这些蛋白在数据库中找不到"亲戚",功能注释随之陷入僵局。研究团队指出,这一问题并非果蝇独有,在昆虫乃至所有生物类群中普遍存在,严重阻碍了我们对生命多样性的深层理解。
研究团队转换了观察维度。他们不再紧盯一维的氨基酸序列,而是直接预测蛋白质的三维构象。
基于人工智能的蛋白结构预测方法(如AlphaFold2等深度学习模型),团队对824个代表性昆虫物种开展大规模结构预测,构建出包含1329万个蛋白结构的综合数据集。这是迄今规模最大的昆虫蛋白结构图谱,覆盖全部28个目中的4854种昆虫。
数据分析揭示了一个反直觉的规律:许多昆虫蛋白的一级序列差异显著,但三级结构高度保守。这意味着即便两个蛋白的氨基酸序列相似度低于30%,它们仍可能折叠成几乎相同的三维构象,执行相似的生物学功能。基于这一发现,团队提出了"蛋白序列分化—结构保守—功能等价"的新研究范式,为解析远缘同源蛋白功能奠定了方法论基础。
![]()
研究中最引人注目的发现涉及先天免疫系统。团队鉴定出一类名为cGLR(环状GMP-AMP合成酶样受体)的免疫受体,这类分子在昆虫中广泛分布且结构高度保守。
cGLR是宿主识别病毒核酸并启动抗病毒反应的关键传感器。过去科学家认为这类受体在昆虫中的分布较为局限,但新研究显示,cGLR实际上存在于多种昆虫类群中,其三维结构呈现出惊人的保守性,跨越了数亿年的演化历史。
研究团队选择埃及伊蚊(Aedes aegypti)进行功能验证。实验证实,埃及伊蚊的cGLR受体在抗登革病毒和寨卡病毒感染中发挥重要作用。这一发现不仅揭示了昆虫抗病毒免疫的新机制,更为研发蚊媒病毒干预策略提供了潜在的分子靶点。考虑到登革热每年感染数亿人,这一基础研究发现具有明确的应用前景。
此项研究的另一项重磅成果是重构了昆虫系统发育框架。团队整合了17个公共数据库的基因组与转录组数据,重建出高分辨率的昆虫生命树2.0。该生命树包含4854种昆虫,覆盖全部28个目,代表了迄今最全面的昆虫演化图谱。
这标志着中国在结构比较基因组学领域已跻身世界前沿。传统上,大型演化基因组学研究主要由欧美主导,如欧洲生物信息研究所(EMBL-EBI)的Ensembl项目和美国的NCBI数据库。此次中国团队不仅建立了面向宏观演化问题的结构比较基因组学框架,更将研究视角从单纯的序列比对拓展到三维结构层面,为全球昆虫学研究提供了关键基础设施。
值得关注的是,研究成果发表于国产顶尖期刊《细胞研究》。这反映了中国在生命科学领域正从"数据贡献者"向"规则制定者"转变。从跟跑国际基因组学大科学计划,到自主构建千万级蛋白结构数据库,中国科学家正在定义下一代生物学研究的基础设施标准。
这项研究的价值远超昆虫学范畴。它为理解蛋白质功能演化提供了结构维度的新视角,也为破解人类基因组中尚未注释的"暗物质"基因提供了方法论借鉴。当AI技术与演化生物学深度融合,那些隐藏在序列迷雾中的生命密码,正逐一显现其本来的功能面目。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.