近期热播综艺《我家那小子》中,两位年近30的艺人体验了一把基因检测项目。一口唾液、一周等回的检测报告给出了对于他们心理特质、营养代谢、运动能力等的评估。有趣的是,检测报告还预测了两人的身高,但却与实际身高出入不小。
基因检测发展初期一直被用于疾病的诊断,近些年的基因检测产品也能为健康人进行不同功能的诊断,包括通过对比得出宗谱等带有娱乐色彩的项目。随着新产品的开发,基因检测能够道出的身体秘密越来越多。
身高基因发力像“集体拔河”
要通过基因预测身高,需要先知道哪些基因和身高有关。过往对25万多人进行的大量全基因组关联分析发现,大约有700个基因区域与身高有关,它们的综合作用可能决定他长1米8,还是只长1米7。
就像集体拔河,700个人参加“拔河”合力只能“拔高”10厘米,那谁是里面发力最大的呢?
为了缩小范围,寻找最有“功劳”的基因,全世界的科学家做了大量的工作。他们有的对有明显身高差别的不同种族人群进行了全基因组的序列分析,找到群体序列间的差别,确定部分突出基因。有的在对模型动物的疾病研究中“无心插柳”,观察到某一基因的突变影响了动物的骨骼发育,认为其与身高相关。
例如,哈佛医学院研究者发现矮的秘鲁人携带了一种叫做FBN1基因的等位基因,该等位基因与FBN1通常的DNA序列在1个碱基上存在差别,这一微小的差别改变了纤维蛋白-1(在结缔组织中提供结构支持)中的一个氨基酸。携带一个这种突变的人会矮约2.2厘米,而携带2个这种FBN1突变的人则会矮4厘米以上。
再例如有研究人员发现携带SPAG17基因定向突变的小鼠胫骨和股骨短于正常小鼠,它们有骨骼畸形和骨矿化缺陷。
不过上面的研究就像“点名”,难以分离出究竟有哪些基因在人体长高的过程中起着决定性作用。而另一些科学家则希望批量地厘清:影响身高的基因中,究竟有哪些是通过影响骨骼发育进而影响身高的。
2017年12月5日美国《电子生命》发表了哈佛大学的研究,研究人员对700个基因中所有可能的约6万多个与身高相关的基因变异体进行分析,最终发现了约900个基因变异体。这样基因变异影响身高的密码可以精确到单个碱基级别。
2018年,中国科学家在《细胞》上发表论文,通过对14万余例无创产前基因检测数据展开的群体水平研究,一次性发现并且验证了48个与身高以及13个与BMI(身体质量指数)显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。
新技术可能带来新位点
基础研究为寻找身高与基因的关联奠定了基础。对个人而言,要进行实际测序,才能获取每个个体不同他人的数据。
人基因组测序的方法叫重测序(Resequence)。华大智造首席运营官蒋慧介绍,人类基因组计划构建出来参考基因组集,现在每个人测基因组的时候,并不是把个体的基因组组装出来,而是把个体的基因组测完后和参考基因组做比较。
对于有具体功能基因测序产品来说,一般不会对每个人进行全基因组的测序,而是针对具体的功能进行确定位点的测序,再进行分析比对。
“每个人的基因组是有差异的,与统一的参考模板比对,会让很多差异难以体现,比如除开在单碱基上的突变,还可能存在一些个体独有的序列难以发现。”蒋慧说,未来随着基因测序成本的降低,如果每个人都进行从头测序,也就是真正的个人自己的基因组,将可以反应个体的信息,会是一个重要的跨越,很可能发现更多不同的信息。
相似的研究正在进行,《自然》曾发表一项由波士顿儿童医院、博德研究所、伦敦玛丽女王大学等近280个研究团队共同完成的大规模研究,不采用传统的全基因组关联分析技术,改为采用外显子芯片技术。因为前者虽然能够成功挖掘出常见的基因突变但不能筛选出相对罕见却影响显著的遗传变异,且分析范围不包括更有潜力的非编码区域。
通过新技术,研究团队找到了83个罕见的遗传变异,它们被证实会直接影响蛋白质表达,从而显著影响人类身高。其中24个基因变异对身高的影响超过1厘米。
数据分析考验模型和策略
一个生物的表型是多个因素综合作用的结果,比如身高,不仅与骨骼发育有关,还与营养物质的吸收、生长素的分泌等其他因素相关,那么其他关联的基因是否要进行检测,并以多少权重加入到算法和模型的构建中,对于不同的测序分析公司来说应该是不同的。
检测是基础,但数据分析是关键。
到数据分析、出报告的阶段,基因检测已经走出了生物学的范畴,而进入了模型构建、信息处理等信息学的范畴。
《我家那小子》中的专家表示,目前酒精代谢的检测是相对较准的。但就是这样一个关联基因较少、位点确切的检测要想更准确或者反应更多的东西,算法程序也不能是“单线程”,归根结底,人体是错综复杂的整体。
“华大开发出的对酒精代谢的‘微醺’检测最初检测的也是与酒精代谢相关的位点。”华大基因工程师郭瑞东介绍,但在升级后的“微醺”里,还包括了更多位点。有一个属于FTO基因,当初设计微醺时,认为该基因是与酒精的味觉相关的。不过在2015年9月份,研究者们在权威期刊《新英格兰医学》的一篇论文上发现,FTO基因的不同会影响前脂肪细胞的线粒体产热机制,从而细胞自发地由能量消耗的棕色脂肪细胞(好的)转换为能量存储的白色脂肪细胞(使你变胖的元凶)。
看到这则报道,微醺团队的科学家想到在已有的微醺产品中,是要求用户填写其身高体重的,既然也测了FTO基因,那为什么不能拿微醺的数据去验证一下这个发现呢?于是他们计算了微醺用户的BMI与其FTO基因的相关关系。结果显示,微醺的数据验证了新英格兰医学上的结论。
因此,对于基因数据来说,挖掘是一门充满想象的“艺术”。
“科学上对许多基因的功能的研究还不够透彻,一个基因可能与多项功能相关,因此基因检测的预言准确性更多停留在统计意义上。”郭瑞东表示,但不管检测的结果是否符合预期,基因检测产品都会为个人给出个性化的信息。让基因给出建议,是基因检测产品的最大价值所在。
听取基因检测建议的最著名例子,是好莱坞女星安吉丽娜·朱莉通过基因检测,选择切除乳腺手术降低患乳腺癌的风险。她的做法是否妥当有无过激,观点不一。但无论基因检测给出的建议是什么,在具体实施方面必须听取专业意见是毋庸置疑的,毕竟如果根据建议进行干预,一旦需要寻医问药,则是进入诊疗阶段,需要兼顾资质和规范。