网易首页 > 网易号 > 正文 申请入驻

DeepMind最新AI工具登Science,准确分类89%的「错义突变」

0
分享至

编辑 | 萝卜皮

在人类基因组中所观察到的绝大多数错义突变可能具有未知的临床意义。

Google DeepMind 团队提出了 AlphaMissense,它是 AlphaFold 的一种改进衍生工具,在人类和灵长类动物突变群体频率数据库上进行了微调,从而用于预测错义突变(missense variant,missense mutation )的致病性。

通过结合结构背景和进化保护,该模型在广泛的遗传和实验基准上取得了 SOTA 的结果,并且,所有这些都无需对这些数据进行明确的训练。

基因的平均致病性评分也可以预测其细胞必需性,能够识别现有统计方法无法检测到的短必需基因。作为社区的资源,该团队提供了所有可能的人类单氨基酸取代的预测数据库,并将 89% 的错义突变分类为可能良性或可能致病。

该研究的最新进展以「Accurate proteome-wide missense variant effect prediction with AlphaMissense」为题,于 2023 年 9 月 19 日发布在《Science》。

什么是错义突变?

错义突变是 DNA 中的碱基替换,导致蛋白质内产生不同的氨基酸。如果将 DNA 视为一种语言,那么交换一个字母就可以改变一个单词并完全改变一个句子的含义。在这种情况下,替换会改变翻译的氨基酸,这可能会影响蛋白质的功能。

每个人平均携带超过 9,000 个错义突变。这些突变大多数是良性的,对生活几乎没有影响;但也有少数是具有致病性的,可以严重破坏蛋白质功能。错义突变可用于罕见遗传病的诊断,其中少数甚至单个错义突变可能直接导致疾病。它们对于研究复杂疾病也非常重要,例如 Ⅱ 型糖尿病,这种疾病可能是由许多不同类型的基因变化组合引起的。

对错义突变进行分类是了解哪些蛋白质变化可能引起疾病的重要一步。在人类基因组中已发现的超过 400 万种错义突变中,只有 2% 被专家注释为致病性或良性;这些被注释过的突变大约占所有 7100 万种可能错义突变的 0.1%。其他突变则被认为是「意义不明的突变」,因为缺乏关于其影响的实验或临床数据。借助 AlphaMissense,研究人员通过使用阈值对 89% 的突变进行分类,对已知疾病突变的数据库产生了 90% 的精确度,从而获得了迄今为止最清晰的图片。

致病性或良性:AlphaMissense 如何对突变进行分类

基于蛋白质结构预测模型 AlphaFold 所开发的 AlphaMissense,可以预测改变蛋白质单个氨基酸的错义突变的致病性。

图:AlphaMissense 概述。(来源:论文)

为了训练 AlphaMissense,DeepMind 团队在标签上对 AlphaFold 进行了微调,用于区分人类和密切相关的灵长类动物群体中发现的突变。它所遵循的原则是,常见的突变被视为良性,从未见过的突变被视为致病。

DeepMind 研究副总裁兼研究作者 Pushmeet Kohli 在新闻发布会上表示:AlphaMissense 并没有确定突变的结构影响(生物学中的一个公开挑战),而是利用 AlphaFold 对结构的「直觉」来识别蛋白质中可能发生致病突变的位置。

所以,AlphaMissense 不能预测突变后对蛋白质稳定性的其他影响。相反,它利用相关蛋白质序列和变体结构背景的数据库来产生 0 到 1 之间的分数,大致评定变体致病的可能性。连续评分允许使用者选择符合其准确性要求的阈值,将突变分类为致病性或良性。

AlphaMissense 还整合了一种受 ChatGPT 等大型语言模型启发的神经网络,该模型已接受数百万个蛋白质序列而不是单词的训练,称为蛋白质语言模型。事实证明,它们擅长预测蛋白质结构和设计新蛋白质。

共同领导这项研究的 DeepMind 研究科学家 Ziga Avsec 表示,它们对于突变预测是有现实意义的,因为它们已经了解了哪些序列是合理的,哪些是不合理的。

图:AlphaMissense 如何对人类错义变体进行分类。(来源:Deepmind网站)

AlphaMissense 在广泛的遗传和实验基准上实现了最先进的预测,所有这些都无需对此类数据进行明确的训练。当用于对 ClinVar(人类突变与疾病之间关系的公共数据档案)的突变进行分类时,该工具优于其他计算方法。它还擅长识别实验室实验中所发现的问题突变,同时测量数千个突变的影响。

图:AlphaMissense 在预测错义突变效应方面优于其他计算方法。(来源:Deepmind网站)

错义突变目录

使用 AlphaMissense,该团队得到了一份人类基因组中每一种可能的错义突变的目录,确定 57% 可能是良性的,32% 可能导致疾病。

DeepMind 已将 AlphaMissense 的预测免费提供给科学界。他们还与 EMBL-EBI 一起,通过 Ensembl Variant Effect Predictor 使预测目录对研究人员来说更易于使用。

除了错义突变查找表之外,该团队还分享了对 19,000 多种人类蛋白质中所有可能的 2.16 亿个单氨基酸序列替换的扩展预测。还包括了每个基因的平均预测,这类似于测量基因的进化约束——这表示某个基因对于生物体生存的重要性。

图:AlphaMissense 预测叠加在 AlphaFold 预测结构上的示例(红色=预测为致病性,蓝色=预测为良性,灰色=不确定)。(来源:Deepmind网站)

加速遗传疾病研究

斯德哥尔摩大学计算生物学家 Arne Eloffson 表示,AlphaMissense 相对于现有的预测突变影响的工具来说是一个进步,「但并不是巨大的飞跃」。

英国爱丁堡 MRC 人类遗传学单位的计算生物学家 Joseph Marsh 同意 Eloffson 的看法,它的影响不会像 AlphaFold 那样显著,AlphaFold 开创了计算生物学的新时代。「也是兴奋的。这可能是我们目前拥有的最好的预测器。但这会是两三年后最好的预测吗?很有可能不会。」

Marsh 表示,目前计算预测在诊断遗传疾病方面发挥的作用很小,医生团体的建议称,这些工具应该只提供将突变与疾病联系起来的支持证据。Avsec 表示,与之前的方法相比,AlphaMissense 自信地对更大比例的错义突变进行了分类。「随着这些模型变得比我想象的更好,人们会更倾向于信任它们。」

佐治亚州亚特兰大埃默里大学的生物信息学家 Yana Bromberg 强调,诸如 AlphaMissense 之类的工具在应用于现实世界之前,必须使用良好的性能指标进行严格评估。

例如,一项名为基因组解释批判性评估(CAGI)的活动多年来一直根据尚未发布的实验数据对此类预测方法的性能进行基准测试。Bromberg 补充道:「想到医生做出预测并执行预测,就好像它是真实的一样,而没有经过 CAGI 等实体的评估,这是我最糟糕的噩梦。」

对此,DeepMind 团队表示,他们一直与 Genomics England 合作,探索这些预测如何帮助研究罕见疾病的遗传学。Genomics England 将 AlphaMissense 的发现与之前与人类参与者汇总的变异致病性数据进行了交叉引用。Genomics England 的评估证实了 AlphaMissense 预测是准确且一致的,这相当于提供了另一个现实世界的基准。

总而言之,AlphaMissense 确实提供了一条研究疾病的重要路径,相信它的转化研究可以在人类医疗方面发挥更大的作用。

目录链接:https://zenodo.org/record/8208688

论文链接:https://www.science.org/doi/10.1126/science.adg7492

https://www.nature.com/articles/d41586-023-02943-5

https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乱打比方的环保局长,顺手带走了“县委主要负责同志”

乱打比方的环保局长,顺手带走了“县委主要负责同志”

民言民语
2024-05-29 15:25:15
“京城第一名媛”被全网封杀:畸形价值观,毒害了多少中国人?

“京城第一名媛”被全网封杀:畸形价值观,毒害了多少中国人?

小椰子专栏
2024-05-29 13:01:53
上海街头这辆“老头乐”太炸裂!“保时捷”“法拉利”合体,车主原本还打算……

上海街头这辆“老头乐”太炸裂!“保时捷”“法拉利”合体,车主原本还打算……

新民晚报
2024-05-29 16:04:29
庆余年:直到费介死在“机器人”手上,才发现,五竹为何总是失忆

庆余年:直到费介死在“机器人”手上,才发现,五竹为何总是失忆

白公子探剧
2024-05-29 10:53:58
三大指数全线翻绿 下跌个股近3000只

三大指数全线翻绿 下跌个股近3000只

每日经济新闻
2024-05-29 14:16:06
杜加里奇再度发声:希望加入中国国籍!为国足效力是我的荣幸

杜加里奇再度发声:希望加入中国国籍!为国足效力是我的荣幸

奥拜尔
2024-05-29 15:57:53
“美国只顾着对华制裁,可能重蹈清朝覆辙”

“美国只顾着对华制裁,可能重蹈清朝覆辙”

观察者网
2024-05-29 11:11:11
媒体人:若国足在中泰战输球,中国男足球员薪水可能还会继续下降

媒体人:若国足在中泰战输球,中国男足球员薪水可能还会继续下降

直播吧
2024-05-29 11:50:08
胡广杰、徐缨辞去江苏省人民政府副省长职务

胡广杰、徐缨辞去江苏省人民政府副省长职务

界面新闻
2024-05-29 16:36:30
奥沙利文:不希望斯诺克被纳入奥运会,不想努力四年只为了拿金牌

奥沙利文:不希望斯诺克被纳入奥运会,不想努力四年只为了拿金牌

直播吧
2024-05-29 12:31:16
美国巨星约翰尼遭枪击身亡!享年37岁,他并没反抗本来可以不用死

美国巨星约翰尼遭枪击身亡!享年37岁,他并没反抗本来可以不用死

娱乐白名单
2024-05-29 12:04:08
钱到账了,娃哈哈一线员工实发工资曝光

钱到账了,娃哈哈一线员工实发工资曝光

爱看剧的阿峰
2024-05-29 02:09:50
韩国发现90多个装有粪便垃圾的朝鲜气球

韩国发现90多个装有粪便垃圾的朝鲜气球

花非花008
2024-05-29 14:02:38
豪言不假!爱德华兹29+10+9连中制胜球 拼到5犯终赢东契奇一场

豪言不假!爱德华兹29+10+9连中制胜球 拼到5犯终赢东契奇一场

醉卧浮生
2024-05-29 11:12:34
上海一老板跑路,900人失业,公司创立仅1年多,已经亏损62亿!

上海一老板跑路,900人失业,公司创立仅1年多,已经亏损62亿!

古希腊掌管松饼的神
2024-05-28 22:56:03
武汉市市长程用文,任湖北省副省长

武汉市市长程用文,任湖北省副省长

新京报政事儿
2024-05-29 17:05:17
俄财政部长称俄罗斯人自己想提高税收,税收即将大幅上涨

俄财政部长称俄罗斯人自己想提高税收,税收即将大幅上涨

亡海中的彼岸花
2024-05-29 07:48:02
伊朗代理总统穆赫贝尔刚上任,便以惊人胆识向美国表达了友好意愿

伊朗代理总统穆赫贝尔刚上任,便以惊人胆识向美国表达了友好意愿

橘色数码
2024-05-29 13:48:54
广州楼市新政出台当晚,“90后”女生在机场转来20万订金

广州楼市新政出台当晚,“90后”女生在机场转来20万订金

南方都市报
2024-05-29 04:48:17
女子跟相亲对象回家,刚看到男子家就想撤:这是你说的有车有房?

女子跟相亲对象回家,刚看到男子家就想撤:这是你说的有车有房?

雅清故事汇
2024-05-28 16:13:35
2024-05-29 18:00:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
9031文章数 141933关注度
往期回顾 全部

科技要闻

王传福再放狠话,燃油车要成“非主流”

头条要闻

安徽全椒县"拿茅台比方污水"局长被免职

头条要闻

安徽全椒县"拿茅台比方污水"局长被免职

体育要闻

巴黎主席向皇马索要8000万 佛爷:1分不给

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

健康
亲子
手机
家居
公开课

晚餐不吃or吃七分饱,哪种更减肥?

亲子要闻

六一儿童汇演能有多搞笑,男孩模仿宋小宝“咖妃”名场面,网友:当代小孩黑历史都是高清的

手机要闻

传言称 iPhone 16 Pro 电池容量与尺寸将小幅增加

家居要闻

与美共生 空间线条勾勒生活风雅

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版