本文节选自《基因彩票》,上一章链接:
《基因彩票:运气、平等与补偿性公正》,作者是凯瑟琳·佩奇·哈登,行为基因学家、临床心理学教授,曾发表100多篇关于遗传对复杂人类行为影响的科学论文。《基因彩票:运气、平等与补偿性公正》提出一个有趣的概念:除却家庭与社会环境的“卵巢彩票”之外,一个人还要经历遗传因素随机匹配机制的“基因彩票”抽奖。作者认为承认“基因彩票”的作用,才能更好地追寻一个在技术和生理上较为平等的社会。
近期我将会在网易号平台将这本书的各个章节分享给大家,感兴趣的网友可以去买一本实体书。
第三章:食谱和大学
当我儿子还是个婴儿时,儿科医生向我们推荐了一位神经科医生,因为她怀疑我儿子患有1型神经纤维瘤病(谢天谢地,只是虚惊一场)。神经纤维瘤病是一种罕见的遗传疾病,会在大脑、脊髓和神经末端产生无数的肿瘤。 注【“Neurofibromatosis Type 1,”Genetics Home Reference,accessed November 7,2019,https://ghr.nlm.nih.gov/condition/neuro.bromatosis-type-1.】 它是由NF1基因的突变引起的,作为一种负责编码蛋白质的基因,NF1通常可以防止细胞像常春藤缠结在一起那样过度生长。神经纤维瘤病的主要症状之一是皮肤上出现咖啡牛奶斑,即加奶咖啡颜色的斑点。我儿子身上有两个这样的斑点。
我的新宝宝可能患有严重的遗传病,这当然是很可怕的。我当时的丈夫花了一个下午的时间来检查儿子的皮肤,翻来覆去,一遍又一遍,生怕有更多的咖啡牛奶斑被我们漏掉了。而我一整天都异常平静,然后在入睡之后陷入逼真的噩梦。在一个噩梦中,一个沉默的、像天使一样的生物给了我一把镊子,并告诉我,我可以治愈我孩子的神经纤维瘤病。但要做到这一点,我必须在天亮之前从他身体的每个细胞中一个一个地拔出NF1基因的突变。我开始了这项不可能完成的任务。我知道我不可能及时处理每一个细胞,但还是疯狂地用神奇的镊子戳着他小小的身体。
那是一个可怕的噩梦。它彰显了我们在思考基因时可能想到的东西的本质:基因具有我们无法逃避的强大力量,一个扭曲的分子可能决定一个人的整个命运。如果你有NF1基因的某种突变,你将不可避免地患上神经纤维瘤病。希腊的命运女神阿特洛波斯负责用“可恶的剪子”剪断生命线, 注【John Milton,Lycidas,accessed November 7,2019,https://www.poetry foundation.org/poems/44733/lycidas.】 而NF1基因突变意味着,某种医学上的命运是不可逆转的。
2013年,《科学》杂志发表了一项涉及超过12万人的研究结果,发现有三个遗传变异与受教育程度(即一个人完成了多少年的学业)有关。 注【Cornelius A.Rietveld et al.,“GWAS of 126,559 Individuals Identifies Genetic Variants Associated with Educational Attainment,”Science 340,no.6139 (June 21,2013):1467–71,https://doi.org/10.1126/science.1235488.】 按照科学惯例给这三个变异取的名字仿佛是从斯塔西(Stasi)的档案系统中借来的:rs9320913、rs11584700和rs4851266。
这个结果(事实上,这项研究本身)看起来就像我被赋予一套神奇的基因编辑镊子一样可怕。总的来说,我们大多可以接受这样的观点:我们的基因决定了我们眼睛的颜色,或者我们会不会罹患像神经纤维瘤这样的罕见疾病。但获得良好的受教育程度是一种成就,是人生的一种成绩。而且,正如我在第一章中描述的,受教育程度与生活结果中几乎所有其他的不平等都有关联。但现在有人说,受教育程度是命中注定的,一个名为rs11584700的遗传阿特洛波斯可以消灭你的成就,可以剥夺你的成绩。这种想法难道会是真的吗?
我将在本章(乃至全书)中论证,把rs11584700和受教育程度之间的关系,看作像NF1基因和神经纤维瘤病之间的关系,是一个错误。一个人的基因并不能决定他的教育结果或经济命运。但与此同时,如果把基因和教育之间的关系视为微不足道或不重要,也是错的。正如我们在上一章看到的,一个人的基因可能不会决定他的生活结果,但仍然关系到他在退休时能否比别人多拥有数十万美元的财富。为了理解应当如何认真对待基因与教育的关联,而不误解这些关联,我们需要更详细地了解这类研究究竟在做什么(以及它们没有做什么)。因此,让我们来探讨一下《科学》刊登的这项研究。研究者究竟是如何得出结论,认为rs9320913、rs11584700、rs4851266是与受教育程度相关的遗传变异,而我们又如何解释这一结果?
遗传食谱,基因组烹饪书
2013年《科学》刊登的这篇论文的主要作者之一是经济学家菲利普·科林格(Philipp Koellinger)。科林格身材瘦高,四十多岁,笑起来很爽朗,打破了人们对德国人和经济学家的刻板印象。他坚持认为,他参与创立的社会科学遗传学协会联盟(SSGAC)并不真正指望在他们的这篇论文中发现什么。毋宁说,他们是对之前的一系列心理学研究感到恼火,这些研究声称发现了与智力测试分数相关的基因,但研究样本太少,所以从统计学上看,其结论不可能是正确的。
(有人会把几年的时间投到一个项目中,收集12万人的数据集,以明确证明别人是错的。如果你对此感到惊讶,只能说明你不了解经济学家这个群体。)
科林格最喜欢吃柠檬鸡,而且是整只鸡,它依偎在洋葱和土豆之上,用等量的柠檬汁和橄榄油烘烤。他第一次访问得克萨斯州时为我做了柠檬鸡,并对做出来的效果与他在荷兰家中做的不同感到惊讶。得克萨斯H-E-B超市里的特大号酸柠檬产自加利福尼亚而不是西班牙。得克萨斯的土豆没有明确标明是适合软烘还是硬烘,所以他买的土豆解体成了美味的、适合婴儿的土豆泥。我那台陈旧的小烤箱,充其量只能粗略地设置温度。而且在得克萨斯州,什么都是大号的,家禽也是如此。我们这顿饭是在一个温暖的三月夜晚的户外吃的,很美味,但口味肯定与他在阿姆斯特丹的厨房里按照自己的食谱做的柠檬鸡不同。
所有关于基因的比喻都是错误的,但食谱的比喻是有用的:基因就像一个蛋白质的食谱。有些基因是编码基因,意思是它们直接给出了制造蛋白质的指令。其他的DNA片段的作用更像是在食谱正文周围用笔写下的注释,相当于说明书的说明书,仿佛是提醒你把黄油从冰箱里拿出来,以便它能达到室温。
任何一位家庭大厨都可以证明,完全相同的食谱可以产生截然不同的菜肴,这取决于可用的原材料和变幻无常的环境。奥斯汀的烤鸡和阿姆斯特丹的烤鸡是不同的。同样,基因在蛋白质中的表达,也会因组织、人和环境而异。也许最重要的是,在厨房抽屉里有一本食谱,并不代表你就能吃到东西。为了创造最终的产品,必须发生一些事情。
不过,最终产品是什么,确实受到食谱的限制。你拿着柠檬鸡的食谱,不会做出巧克力片曲奇。食谱如果有错,可能导致你做出一道稍微不那么合胃口的菜(比如盐不够)或实在太难吃,完全不能入口的菜(放了一杯盐而不是一杯糖)。同样,DNA序列的突变可以导致蛋白质的轻微改变或完全丧失功能。而且,有些食谱比其他食谱更能容忍错误、偏差和替代。正如制作意大利肉酱面不需要像制作巧克力蛋奶酥那样严格注意重量、温度和时间,有些基因比其他基因更不能容忍变异。
所有的比喻都有缺陷,但食谱是一个说得过去的比喻,可以帮助我们理解单一基因和单一蛋白质之间的关系。例如,LRRN2是富含亮氨酸重复神经元蛋白的基因“食谱”,重复神经元蛋白分子有助于使细胞粘在一起。但本书的主题不是蛋白质,而是人。LRRN2序列的一个小变化与大学能否毕业有关(关系非常、非常、非常弱),但LRRN2并不是上大学的“食谱”。我们需要将食谱的比喻延伸到一个新的方向,去理解大量基因的集体作用,从而建立一种关于“基因如何与距离分子生物学层面很远的结果相关”的新认识。
如果一个基因是一个食谱,那么你的基因组(包含在你所有细胞的23对染色体中的所有DNA)就是一个庞大的食谱集,一本巨大的烹饪书。当我写作本书时,我正在看我书架上的食谱书《丰饶》(Plenty),这本素食食谱集来自名厨尤坦·奥图兰吉(Yotam Ottolenghi)开在伦敦的餐厅。假设你和朋友在奥图兰吉餐厅举行一个小型午餐派对。你的朋友刚刚升职,或者她宣布她终于怀孕了。你正在享用石榴籽烤茄子和山羊奶酪焦糖茴香。餐厅的服务很周到。伙伴们欢快而活泼。《丰饶》是你正在享用的食物的食谱(recipe),但它并不是你正在享受的这场派对的“诀窍”(recipe)。
为什么不是呢?最明显的是,除了食物之外,还有很多因素会影响你的小午餐派对,从物理环境(灯光太亮或音乐太响,或椅子太让人腰酸背痛)到社会环境(你的朋友是情绪糟糕还是活泼愉快?)和文化层面(烤茄子是你熟悉的、让你想到家庭温暖的疗愈美食,还是令人激动的新鲜菜肴?)。总体的体验是由这么多相互作用的维度共同决定的,以至于有些问题完全是无稽之谈。“对于你今天的就餐满意度来说,哪一个更重要:在食物中加盐还是有一把椅子可以坐?”这就是一个愚蠢的问题。
同样,人类的生活是由基因和环境的相互作用共同决定的。经典的“先天与后天”(nature versus nurture)之争试图决出其中哪一个更重要。但如果我们记住,基因就像一个食谱,它会指示厨师在食物中放盐,而环境就像有一把椅子可坐,我们就可以看到,所谓的“先天与后天”辩论也是在问一个愚蠢的问题,因为基因和环境总是都很重要。
同时,即使我们始终牢记环境的重要性,我们也可以看到,基因组的差异对于我们理解人与人之间的差异关系重大,正如食谱的差异关系到我们与餐厅之间的差异的理解。不可否认,在奥图兰吉餐厅用餐的体验是由具体选择哪本食谱集塑造的。如果餐厅突然改成只提供安东尼·伯尔顿(Anthony Bourdain)的《传统法式料理》食谱中的菜肴,你的午餐派对就会变得大不一样。这是我们从几十年来人类行为遗传学研究中得到的基本的、无可争议的道理。如果你的基因组换了一种样子,你的认知能力、个性、教育、心理健康、社会关系都会有所改变。换言之,你的整个生活也会随之不同。
并非所有的差异都同等重要。基因组之间的一些差异类似于在一本食谱中用“糖”取代“盐”,或将每份食谱中的盐量增加一倍或两倍。亨廷顿舞蹈症就是一个很好的例子。HTT基因是亨廷顿蛋白的“食谱”,它在特定位点包含一段连续重复序列(如同重复“加入1/4茶匙孜然,加入1/4茶匙孜然,加入1/4茶匙孜然”)。导致亨廷顿舞蹈症的HTT基因版本在这个位点包含了太多次的重复,导致HTT基因异常长。然后这种蛋白质被剪成小的黏性碎片,在一个人的神经元内聚在一起。亨廷顿舞蹈症的所有可怕症状(抑郁和愤怒、抽搐的动作,最终丧失走路、说话和吃饭的基本能力)都可以追溯到单独一个蛋白质“食谱”的变化。
不过,人类之间的大多数遗传差异并不像用糖代替盐,也不像大幅度改变一种重要成分的数量,而像把“洋葱”这个词换成“韭葱”。科学家面临的挑战,是了解基因组中这种微小的变化对于理解人类生活之间的差异是否真的有意义,以及如果有意义,又是为什么。
一次一个成分
让我们暂时把关于人生的问题放一边,重新拾起餐厅的比喻。如何确定微小的食谱变化是否会对人们的用餐体验产生影响?一种办法是,从你已知的关于烹饪和饮食的知识开始,然后将范围缩小到你认为可能很重要的一种成分。比如……香菜?有些人认为香菜的味道像肥皂,所以小心翼翼地把每片香菜小叶子从塔可上刮下来。掌握了“有些人不喜欢香菜”的知识,你就可以在城里挑选20家餐厅,看看他们提供的菜肴中是否包含香菜。
是的,只有20家餐厅,这确实不算多。但为了弥补样本太少的缺陷,你可以非常仔细地衡量人们的用餐体验。你不单单是问大家有多么喜欢他们的饭菜。你应当派一个训练有素的调查员,去数人们在吃饭时笑了多少次;你应当看看顾客的信用卡账单,看他们一年中在那家餐厅花了多少钱。到一天结束时,你只有关于一种成分的数据,只在几家餐厅测量过,但你对你试图测量的结果非常非常了解。然后,你可以继续测试你的假设是否正确:不提供香菜的餐厅,是否拥有更快乐的顾客?
这是许多心理学家和遗传学家在21世纪初采取的策略,即从一些关于生物学的先验(a priori)知识出发,将注意力集中在一个遗传成分上,并在相对较少的人群中非常密集地测量一个结果。这种方法被称为候选基因(candidate gene)研究。最著名的候选遗传变异被称为5HTTLPR,即血清素(被缩写为5HT,这有点让人糊涂)转运体基因连锁多态区域。 注【Avshalom Caspi et al.,“Influence of Life Stress on Depression:Moderation by a Polymorphism in the 5-HTT Gene,”Science 301,no.5631 (July 18,2003):386–89,https://doi.org/10.1126/science.1083968.】 研究者的想法相对简单。我们已经认为血清素与抑郁症有关,因为如果你给患者服用针对血清素的抗抑郁药(如百忧解),他们的抑郁症(有时)会减轻。5HTTLPR是某个特定基因组的一个微小部分,该基因组会影响血清素在人的大脑神经元之间的穿梭。所以,也许拥有不同版本5HTTLPR的人,受抑郁症的影响程度会有所不同。
再进一步说,我们还知道,压力大的人更容易得抑郁症。离婚、失业、贫困、受虐待的童年,诸如此类的压力是抑郁症的最有力的预测器。因此,也许5HTTLPR变异并不会导致你变得抑郁,除非你已经在某种程度上受到了压力。
为了验证这一假设,研究者花费了数千万美元,不仅测量人们的DNA(这在过去和现在都变得越来越便宜),还仔细测量人们的大脑和思想的一切,比如他们是否符合医生对抑郁症的临床定义,也包括他们唤起悲伤记忆的速度,他们的眼睛在看令人悲伤的图片时花了多少毫秒,以及他们在听悲伤的音乐时大脑的哪些部分亮了起来。在数以百计甚至千计的科学研究中,同样的结果不断出现,即5HTTLPR变异会导致压力大的人变得抑郁。
问题是,所有这些结果都是错误的。到2019年,经过多年的礼貌警告、统计学上的抱怨,以及对似乎无穷无尽的5HTTLPR研究的不断升级的恼怒,心理学家马特·凯勒(MattKeller)发表了一项研究,其标题丝毫不拐弯抹角——《在多个大样本中,无证据表明历史上的候选基因或基因互作与严重抑郁症有关联》。 注【Richard Border et al.,“No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression Across Multiple Large Samples,”The American Journal of Psychiatry 176,no.5 (May 1,2019):376–87,https://doi.org/10.1176/appi.ajp.2018.18070881.】 精神病学家、博客作者斯科特·西斯金德没有遵守科学期刊的礼貌惯例,而是对凯勒论文的结论作了更生动的总结。西斯金德谴责那些报告5HTTLPR“结果”的研究者,认为他们是在编造独角兽的故事,只不过更糟糕:“这不仅仅是一个探险家从东方回来,声称那里有独角兽。这是探险家在描述独角兽的生命周期,独角兽吃什么,独角兽的所有不同亚种,独角兽身上的哪种肉最好吃,以及详细描述独角兽和大脚怪之间的摔跤比赛。” 注【Scott Alexander [Siskind],“5-HTTLPR:A Pointed Review,”Slate Star Codex,May 8,2019,https://slatestarcodex.com/2019/05/07/5-httlpr-a-pointed-review/.】
从今天的角度来看,候选基因方法的主要问题是显而易见的,那就是没有单一的基因可以导致抑郁症,就像没有单一的食谱成分可以让餐厅成功一样。甚至十个基因也做不到。抑郁症、体型、大学毕业、冲动、甚至身高,这些都是复杂的特征,也就是说,在一个关键方面,它们根本不像亨廷顿舞蹈症。它们不是由单一基因引起的。它们受到成千上万个遗传变异的影响,每个变异都产生了微小的影响。由于影响如此之小,我们需要研究的人比早期候选遗传学研究中包括的样本要多得多。
2003年发表的一项早期的、高调的5HTTLPR研究的样本包括847人。2019年发表的对该研究的权威反驳的样本量为44.3264万人,约为前者的500倍。 注【Caspi et al.,“In.uence of Life Stress on Depression”;Border et al.,“No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression.”】 第一项报告某些基因与抑郁症有可靠关联的研究(使用我将在本章下文描述的方法)的样本量为48.0359万人。 注【Naomi R.Wray et al.,“Genome-Wide Association Analyses Identify 44 Risk Variants and Re.ne the Genetic Architecture of Major Depression,”Nature Genetics 50,no.5(May 2018):668–81,https://doi.org/10.1038/s41588-018-0090-3.】 你没有足够的数据(事实上,对于你真正需要的数据,你只掌握了不到1%)就试图找到微小模式(tiny patterns)的一个残酷后果是:你不仅有可能错过真正存在的模式,还有可能采信那些看似真实但实际上只是噪声的假“模式”。
全食谱关联分析注【戏仿“全基因组关联分析”。】
好吧,所以候选基因方法失败了。但你仍然想弄清楚哪些遗传变异(如果有的话)对人们的生活有影响,就好比你想找出对用餐体验有影响的微小食谱变化。A计划(从你的烹饪知识开始,提出看似合理的假设,并以此为基础进行研究)最初看起来很聪明,结果却完全没有产生有价值的知识。为了证明科学家在预测未来方面的成绩有多么糟糕,B计划(宣布你以前的烹饪知识是无用的,并不再尝试提出看似合理的假设)最初看起来不那么聪明,甚至很可笑。不过,正是这种方法最终开始产生结果。
这次,我们不是从在几家餐厅测量单一成分开始,而是把得克萨斯州奥斯汀市的每家餐厅提供的每道菜的食谱都拿出来,并把它们分解成微小的元素。每家餐厅产生的数据集都将是巨大的。会有几千甚至几十万行数据,代表数量、成分、时间、温度、仪器和说明,例如:切细,在300摄氏度下烘烤,一汤匙,孜然,煸炒,呈金褐色。
而且,就像基因组一样,这些数据在绝大多数餐厅都完全一样。所有人的99%以上的DNA都是相同的,就好比每家餐厅都使用盐。
因此,让我们过滤掉各家餐厅完全相同的食谱元素,只保留不同的东西。我家附近的一家餐厅提供油炸博洛尼亚香肠三明治,配上意大利辣腌菜。你不可能在任何地方都能找到意大利辣腌菜。
现在,我们已经把每家餐厅提供的食物分解成一点一滴的数据,我们还需要对餐厅本身进行测量。但我们不再使用仅有20家餐厅的小样本,所以我们没有时间或金钱去做顾客满意度的精细测量。我们需要一些快速和“粗糙”的东西,一些容易在数千家餐厅当中汇编的东西。也许……可以用Yelp评分?
在过去十年里上过网的人都知道,Yelp是一个众包本地企业信息的网站。用户可以在Yelp上写评论,对企业进行一星到五星的评分。一家餐厅要在Yelp上得到高分评价,需要有很多人喜欢在那里吃饭,并留下评论和好评,而且这家餐厅不能有太多差评。截至我写作本书的时候,得克萨斯州奥斯汀市Yelp评分第一的餐厅是一家名为“咸猪”(Salty Sow)的美食酒吧。正如其名字所示,它是所有猪肉菜肴的圣殿,比如糖渍猪肚、宽叶羽衣甘蓝配猪肘、培根魔鬼蛋。评分第二的是一家以炸鸡排闻名的南方风格咖啡馆,评分第三的是富兰克林烤肉店,人们为了吃到有完美焦皮的牛腩片,甘愿在那里排队等候几个小时。
现在,我们需要做的,是把我们在第一步编制的食谱元素数据,与Yelp上的餐厅评分数据结合起来,然后就可以了!我们就有了一个统计分析的雏形。不知提供意大利辣腌菜的餐厅的评分是否更高?
但是,等等!反对之声十分热闹。糖渍猪肚?炸鸡排?牛腩?纯素主义者提醒我们,Yelp的评分并不能反映某些我们也许应该接受的饮食价值观,比如在伦理层面反对吃肉。戴眼镜的时髦人士抱怨说,优先考虑大众市场的满意度与创新精神是对立的。社会学家提醒我们,花大量时间在互联网上匿名发帖的人,并不是真正有代表性的顾客样本。
因此,我们要考虑替代方案。与Yelp评分相比,也许餐厅收入是一个更好的衡量标准?相对于奥斯汀其他提供食物和酒水的商家,“完美10人俱乐部”的生意非常兴隆,但我怀疑那里的顾客不是为了食物来的 注【“完美10人俱乐部”餐厅(Perfect 10 Men's Club)的特色是有脱衣舞表演,并且女服务员衣着性感。】 。也许专家的意见是衡量餐厅质量的更好的标准?毕竟《康泰纳仕旅行者》杂志的前20名名单中,包括了我个人最喜欢的几家餐厅。但话又说回来,也许中年教授的饮食偏好并不具有最广泛的代表性。
反对的声音是正确的。衡量标准确实很重要。食谱上的哪些词与“最佳”餐厅相关,取决于你如何定义“最佳”。专家意见可能会重视具有异域风情的成分(磨碎的海胆,有人想吃吗?),而某家餐厅的利润高,可能是因为食物只需要几乎没有技能或培训的工人就可以廉价而可靠地烹饪,或者服务员是衣着清凉的舞者。
在心理学中,我们花了很多时间来思考这类测量问题。你找到了一个你有兴趣研究的理论实体,或建构(例如,人们对一家餐厅的喜爱程度如何?),然后你需要想出一种方法,将数字有意义地附加到该建构上。什么样的测量方法是最好的?有些测量问题很简单,比如身高可以用英寸来衡量。但是,我们感兴趣的建构往往是难以描述的,而且是有争议的。比如,幸福感的单位是什么?聪明是指什么?什么是好的餐厅?
有些人可能会对试图量化餐厅质量的想法感到反感,不管你怎么去量化。食物的变化是无穷无尽的,怎么能把一座城市的餐厅场景的感官体验和文化体验的织锦浓缩为一个单一的数字呢?在遗传学研究的语境里,人们经常以类似的理由反对测量智力或个性:人也是变化无穷的,怎么能把他们所有的怪癖和才能浓缩为一个单一的数字呢?
简短的回答是:不能。幸运的是,对实体(无论是人还是餐厅)进行“浓缩”,并不是测量的目标。测量是将数字分配给事件或特征的过程,测量对所有的科学学科都至关重要。除非你能测量一样东西,否则你无法科学地研究它。一家餐厅的Yelp评分并不是它的终极衡量标准,而且使一家餐厅成为某人最喜爱的本地餐厅的特质,可能并不反映在匿名网民给它多少颗星上。但是,即使我们全心全意地拒绝“一家餐厅的一切有价值或有趣的东西都可以‘浓缩’为Yelp评分”的想法,我们也可以认为,Yelp评分是一个虽然粗略但仍然有用的衡量人们多么喜欢某家餐厅的标准。
不过,为了使Yelp评分有用,我们需要清楚地了解它的缺陷和局限性。利用Yelp评分来衡量餐厅的研究,给出的是一个不完美的衡量标准,即有多少人说他们喜欢在某家餐厅吃饭。但由此产生的按顺序排列的“好”餐厅名单,可能无法反映一个人对于什么是“好”食物的价值观。
当我教授心理学概论时,我让学生练习用下面的语言来谈论心理学研究:“这项研究是关于建构X的,通过Y来衡量。”例如,这项研究是关于幸福的,通过人们对某事物的评分来衡量,提问就是该事物使得他们今天感觉有多幸福。或者,这项研究是关于社会焦虑的,通过人们被要求在不苟言笑的评委面前做简短演讲时,唾液中的皮质醇(Cortisol)增加多少来衡量。我希望,这种语言练习能帮助学生学会关注“研究者如何测量像幸福和焦虑这样的抽象概念”,并对这些测量可能存在的缺陷感到好奇。
说到底,为了科学地研究一些东西,我们必须测量它们,而测量受到时间和金钱的限制。让我们回到对餐厅质量的研究,以Yelp的平均评分来衡量。我们分析数以百万计的相关关系:在不同餐厅之间,哪些不同的食谱元素与餐厅的Yelp评分相关?
这样运算的结果,可能是一个看起来像疯狂购物清单的东西。清单中的每个条目都会有一个小数字,代表它与一家餐厅的Yelp评分有多大关联。具有真正重大影响的严重的食谱错误,如用糖代替盐,将是罕见的,几乎不存在。如果一家餐厅提供没有盐的食物,它可能过不了多久就会关门,所以不会在我们的数据库中停留足够长的时间。
这种分析会发现一些微小但一致的模式。也许这些模式能证实你之前的一些预感。也许,正如厨师马里奥·巴塔利(Mario Batali)声称的,“酥脆”是卖出最多食物的广告词。也许分析结果会揭示出以前从来没有人想到的模式。无论是否出人意料,由此产生的关联性将非常弱。“我的堡”(Whataburger)快餐店和“昔客堡”(Shake Shack)之间的差异,或许不能归因为一份食谱中的一个词。
不过,无论我们的全食谱关联分析的结果如何,有几件事是显而易见的。首先,这些结果并不意味着餐厅的环境(座位、音乐、灯光、地段和装潢)对人们的体验而言不重要。其次,该分析不会告诉你,允许陌生人对本地企业写匿名评论的网站是不是一个好东西,不会告诉你这种评分是否公平,也不会告诉你,这些评分是否符合你的道德观和审美观,或者是否符合你对一家餐厅应该如何经营的理解。最后,这些结果绝对不会教你如何做饭。它能告诉你的,非常简单,就是在你根据某种衡量标准归类为“高”与“低”的餐厅中,哪些食谱元素更常见。
从全食谱关联分析到全基因组关联分析
全基因组关联分析(GWAS)的工作方式,基本上和我刚才描述的“全食谱关联分析”是一样的。就像把食谱上的个别字词与餐厅的一些可测量特征关联起来一样,GWAS把基因组的个别元素与人类的一些可测量特征关联起来。基因组“食谱”中最常被分析的个别元素,被称为单核苷酸多态性(SNP)。
一个DNA分子是由两条含糖的链组成的,由四种不同类型的核苷酸——鸟嘌呤(G)、胞嘧啶(C)、腺嘌呤(A)和胸腺嘧啶(T)互相配对、紧密结合而成。SNP是人与人之间的遗传差异,有些人的基因组中的一个特定点(基因座)有一个核苷酸,而另一些人有一个不同的核苷酸。你可能有一个G,而我有一个T。SNP的不同版本被称为等位基因(alleles)。通常情况下,一个等位基因比另一个更常见。在人群中不太常见的等位基因被称为次等位基因。每个人的每个基因都有两个拷贝(一个来自母亲,一个来自父亲),所以你可以计算一个人对每个SNP拥有的次等位基因的数量(0,1或2)。GWAS在成千上万的人中测量数百万个SNP,并将每个SNP与表型(phenotypes)相关联。表型就是一个人身上可以测量的东西,如身高、身体质量指数(body mass index)或受教育程度。
即使是数以百万计的SNP,也只是人与人之间存在的遗传差异的总量的一小部分。但是GWAS通常可以忽略基因组的一部分数据,因为每个被测量的SNP都“标记”了其他许多人人有别的遗传变异。打个比方,当你读到一份包含“黑胡椒”字样的食谱时,你可以合理地猜测(即“推断”),该食谱可能也包含“盐”。同样,当人们有一种形式的SNP时,你通常可以合理地推断出其他附近的遗传变异的信息:如果某人在某一特定位置有一个“C”,你通常可以合理地推断他们在另一位置有一个“T”(罕见的变异,即只发生在少数人或少数家庭中的变异,基本上不会被标记)。
我们之所以能够通过测量一个变异来标记多个变异,是卵子和精子细胞的产生方式的结果。让我们回顾一下人类与细菌的区别:人类不是简单地复制自己的DNA,而是进行有性繁殖。也就是说,我们产生精子或卵细胞,每个精子或卵细胞都包含我们一半的DNA,而创造一个完整的人所需的另一半基因组来自有性繁殖的另一方。但在产生精子或卵细胞时,我们的身体并没有将整个染色体的一个完整拷贝打包。相反,在减数分裂的过程中,发生了重组(recombination)。对于我的23对染色体中的每一对,我从母亲那里继承的染色体和我从父亲那里继承的染色体排成一排,互相交换。这种重组过程将遗传变异
重组成全新的组合,这些组合都是彼此不同的。
重组过程是孟德尔在数学观察的基础上推导出的独立分配律(law of independent assortment)的生物学基础。继承基因A的某个版本的概率,与继承基因B的某个版本的概率是相互独立的。
除非,基因A和基因B在基因组内彼此非常接近,那样的话,重组会将父系和母系染色体“洗牌”,但它洗得很糟,让许多张牌粘在一起。当两个基因在物理上比较接近时,在它们之间的某个空间发生重组的机会就比较小。物理上非常接近的基因有可能被一起遗传,而不是被重组“洗”开。由于物理上相互接近而有可能被一起遗传的基因,被称为处于连锁(linkage)中。连锁导致基因相互关联,即处于连锁不平衡状态(linkage disequilibrium,缩写为LD)。
了解人类基因组的LD结构,对于许多目的来说都是非常有用的,包括在全基因组关联分析(GWAS)中使基因组的测量更加高效。但是,如果GWAS发现一个特定的单核苷酸多态性(SNP)与(比方说)受教育程度有关,那么我们就不清楚这种关联是由这个特定的SNP本身驱动的,还是因为我们测量的SNP与一个我们没有测量的变异一起遗传了下来。
那么,我们可以把GWAS结果看作一张基因藏宝图。X标记了藏宝地点,现在你知道海盗的黄金位于某个荒岛的西南部。但是,你登陆荒岛之后发现,那里有一片由藤蔓和密密麻麻的树木组成的丛林,而且你没有办法翻遍丛林的每一寸土地,也就是没有办法对该岛进行“精细测绘”。
我在本章开始时告诉你的2013年的研究就是一个GWAS,它发现了三个与人能否从大学毕业有关的遗传变异。如果你把GWAS看成阅读人们的基因组“食谱”的一种极其粗略的方式,就更容易对其结果产生直观的认识。关于教育的遗传学研究和我们打比方的全食谱关联分析之间有重要的相似之处,这很值得思考。
第一,受教育程度被定义为一个人完成的正规学校教育的时长。这很像餐厅的Yelp评分。一方面,两者都会对真实生活造成影响。Yelp评分低的餐厅可能开不了多久,没有文凭的人找到工作的可能性较小。另一方面,这两个指标都不能完全代表我们可能珍视和重视的所有特征,高分者甚至可能有我们非常讨厌的特征。一家餐厅在Yelp上有很好的评分,可能是因为它在愉快的氛围中提供美味的食物。但它也可能是一家全国性的连锁店,提供工厂化养殖的肉类,并迎合游客的需求,把那些更有特色的本地餐厅排挤掉。一个人在教育领域有很好的成绩,可能是因为他们聪明、求知欲强和勤奋,也可能是因为他们循规蹈矩、规避风险和有强迫症,或者因为他们的其他一些特征(漂亮、高挑、苗条、肤色浅),使他们在一个难免有偏见的社会中享有特权。对在教育体制中取得成功的相关因素的研究,并不能告诉我们这个体制是否良好、公平或公正。
第二,谁能在教育体制中名列前茅,与文化和历史背景有关。在奥斯汀进行的全食谱关联分析的结果(高分餐厅的相关因素),可能与在曼哈顿(更不用说在德里或上海)进行同样的研究的结果大相径庭。同样,对1970年后出生的美国男性进行受教育程度的全基因组关联分析(GWAS),会发现与该人群受教育程度更高相关的遗传变异,但这些遗传变异是否与在高等教育中的性别歧视被取缔之前成年的美国女性的受教育程度相关,就很难说了。这种在不同语境中发现的不一致,并不意味着Yelp评分是衡量餐厅受喜爱程度的一个有严重缺陷的标准,也不意味着GWAS的结果是无用的。不过,这确实意味着,一时一地的测量结果,不一定能代表所有时间和地点。
第三,GWAS的结果并没有以任何方式表明环境对教育不重要。GWAS甚至没有测量关于环境的任何东西。
第四,GWAS本身并不表明我们在“DNA的层面”理解教育,就像对食谱的自动化分析并不表明我们在“食材的层面”理解餐厅的社交活动。
第五,GWAS检测到的相关性是非常、非常、非常、非常弱的。它们也理应如此。“我的堡”快餐店和“昔客堡”之间的差异不能归因为食谱中的一个词,完成博士学业的人和高中辍学的人之间的差异也不能归因为单一的SNP。与受教育程度相关的每个SNP最多只相当于几周的教育,而且大多数SNP的价值比这还要小得多。
第六,GWAS的结果不会告诉你如何烹饪。也就是说,基因组成分(SNPs)的清单并不能帮助我们了解其机制,也就是这些成分如何组合成一个复杂的结果。
噩梦般的,还是可忽略不计的?
当我们考虑到受教育程度与单个单核苷酸多态性(SNP)的关联是多么微不足道,再加上我们无法轻易分辨一个“显著”的关联是由被测量的SNP本身还是由该SNP“标记”的另一个变异所驱动,关于受教育程度的遗传学研究就不再显得仿佛噩梦了。相反,我们开始感觉,它就像将食谱中的词语与餐厅的Yelp评分相关联的研究一样微不足道。SNP rs11584700并不能决定你的命运。它甚至不能让你通过大一的第一次期中考试。所以很多人想知道:那么,为什么还要做GWAS呢?如果你专注于每个SNP对教育的影响程度,就很容易将整个GWAS事业视为浪费时间和金钱。
这就是一些人对GWAS的看法:它并不可怕,也不是优生主义的,而是微不足道和浪费资源的。例如,我的博士生导师埃里克·特克海默就因对GWAS的价值持怀疑态度而闻名。2013年,作为即将离任的行为遗传学协会主席,他在协会年会晚宴上发表了一次如今已经臭名昭著的演讲。晚宴在马赛举办,天空是粉红色和金色的,人们穿着西装外套和晚会长裙出席,气氛很融洽,直到埃里克上台说,做GWAS就像通过研究音乐CD上的凹点(pit)来了解一首歌曲是否好听。听众是为GWAS研究投入了数百万美元和多年心血的科学界同仁,所以埃里克的演讲很不受欢迎。
我当时并不感到震惊,因为我曾多次听到他的这一观点。而且截至2013年,我可能会(暗地里)同意他的观点。年复一年,我听了一个又一个关于努力寻找与美好人生相关的基因的科学讲座。所有这些讲座都以差不多相同的方式结束:“我们目前尚未发现任何东西,但我们只是差更多的样本!”
一连串代价昂贵的失败,再加上,说实话,我对基因组学方法似乎篡夺了传统的行为遗传学工具(双生子研究和家庭研究)的位置感到不满,而我刚刚花了十年时间掌握这些传统工具,因此我很容易同意埃里克的观点。人类的行为实在太复杂。我们不可能通过研究一张CD的凹点来了解德彪西,不可能通过做一项全食谱关联分析来了解一家好餐厅究竟好在哪里,不可能通过将真实的人类生活与SNP相关联来了解到任何有用的东西。
但我们错了。
多基因指数和生活结果的(不)可预测性
要想理解全基因组关联分析(GWAS)为什么有价值,不妨回到我已经告诉过你的东西:任何单个单核苷酸多态性(SNP)和受教育程度之间的关联都是非常、非常、非常、非常弱的。这个结论可能看起来是废话,甚至是理所当然的。但这一结论与全球数以千计科学家的预测相左。在21世纪初,当GWAS方法刚被开发出来时,许多科学家预测,像精神分裂症或自闭症这样的现象可能是由十几个不同的遗传变异引起的。
如果这是真的,那么只要对几千人进行研究,我们就能轻易地了解到基因组的秘密,而且每个基因的影响力也会相对较大。但事实证明,这些早期的预测天真得可笑。精神分裂症、自闭症、抑郁症、肥胖症和受教育程度都与任何单一基因无关。它们甚至与十几个不同的SNP都没有关系。它们是由多基因决定的,也就是说与分散在一个人的基因组中的成千上万个SNP相关。
大规模多基因性(polygenicity)的最明显的例子也许是身高。正如我们在上一章讨论的,非常高的人,如篮球运动员肖恩·布拉德利,之所以这么高,是因为他们继承了非常多的增加身高的遗传变异。身高听起来可能是一个有点无聊的性状,但统计遗传学对身高的研究很多,因为身高很容易准确测量,而且具有高遗传率。几乎每一项生物医学研究都会收集身高的数据,因此研究者可以使用极多的样本。而且基因会影响人的身高这一事实没有争议,这使得科学家们有相对多的空间来建立他们的数学模型。
一个这样的数学模型计算出,有超过10万个SNP可能与人的身高有小的关联。 注【Evan A.Boyle,Yang I.Li,and Jonathan K.Pritchard,“An Expanded View of Complex Traits:From Polygenic to Omnigenic,”Cell 169,no.7 (June 15,2017):1177–86,https://doi.org/10.1016/j.cell.2017.05.038.】 在这些计算的基础上,研究者提出了他们所谓的“全基因”(omnigenic)模型。当然,“全”(omni)的意思是所有,即所有的基因。准确地说,是所有这样的基因:它体现在身体组织中,而这些组织与研究者所研究的东西有关。例如,如果你在研究身高,那么相关的身体组织包括脑垂体(产生生长激素)和骨骼系统,以及其他的。如果你研究的是教育,相关的身体组织就是大脑。 注【James J.Lee et al.,“Gene Discovery and Polygenic Prediction from a Genome-Wide Association Study of Educational Attainment in 1.1 Million Individuals,”Nature Genetics 50,no.8 (August 2018):1112–21,https://doi.org/10.1038/s41588-018-0147-3.】
随着研究结果变得更加多基因化,为了区分信号和噪声,需要研究的样本量也相应增加。如果连身高这样看起来很简单的性状都是由多基因决定的,那么社会和行为结果也同样是由多基因决定的。我在本章开头介绍的第一项关于受教育程度的研究认真考虑了多基因性的影响,所以样本量达到在当时看起来数量惊人的12.6559万人,最后发现了3个与受教育程度有关的SNP。这个研究小组坚持不懈,他们的第二项研究在三年后的2016年发表,样本量为29.3723万人,在基因组中找到了74个与受教育程度有显著关联的SNP。而2018年发表的第三项后续研究,样本量为110万人,发现了1271个与受教育程度有显著关联的SNP。 注【Rietveld et al.,“GWAS of 126,559 Individuals Identifies Genetic Variants Associated with Educational Attainment”;Aysu Okbay et al.,“Genome-Wide Association Study Identifies 74 Loci Associated with Educational Attainment,”Nature 533,no.7604 (May 2016):539–42,https://doi.org/10.1038/nature17671;Lee et al.】 之前有人预测,只要有足够多的样本(也就是人),GWAS可以找到与受教育程度等复杂结果可靠地相关的SNP。事实证明这个预测是正确的。
当一个性状涉及成千上万个遗传变异时,每个变异的微小关联加总起来,就会形成人与人之间有意义的差异。研究者正是这样做的:将所有SNP的信息加总成一个单一的数字。更具体地说,在你做了GWAS之后,你会得到一个长长的数字列表,你测量的每个SNP都有一个数字,代表每个SNP和你的目标表型(在这个案例中是受教育程度)之间的关系强度。然后,你可以根据这一串数字,对新的一组人的DNA序列打分。每个人有多少个与教育相关的遗传变异的拷贝?是0个、1个还是2个?(记住,你的每个基因都有两个拷贝,一个来自你的母亲,一个来自你的父亲)每个SNP的拷贝数乘以它与受教育程度的关系强度,然后将你的基因组中所有被测量的SNP的结果加起来(图3.1)。这个综合指数就是多基因指数(polygenic index)。
上述的受教育程度GWAS的研究者随后在一个新的参与者样本中计算了受教育程度的多基因指数。这些参与者都是在1990年代读高中的美国白人。在那些教育多基因指数最低的人中,大学毕业生的比例是11%。相比之下,在多基因指数最高的人中,大学毕业率为55%。这种差距(高4倍)绝非微不足道。
我已经用教育多基因指数低的人和高的人之间的大学毕业率的差异来描述教育多基因指数和受教育程度之间的关系强度。表达这种关系强度(统计学家称之为“效应值”)的另一种方式是用所谓的决定系数(R2),它衡量的是人们在一个特征上的差异能被我们测量的东西反映的程度。例如,人们的体重不同,而一般来讲高个子的人更重,那么知道人们的身高后,可以在多大程度上解释人们体重的差异?
R2表示为一个百分比,可以在0%和100%之间变化。在身高和体重的例子中,如果R2是100%,那就意味着人们的体重差异单纯是因为他们比别人高或矮,而且我们只需知道一个人的身高就能知道他的体重。如果R2是0%,那就意味着人与人之间的体重差异与他们的身高无关,而且知道一个人的身高无助于了解其体重。在现实中,R2值通常在这两个极端之间。在美国,身高差异大约能解释人们体重差异的20%。换句话说,人的体重差异的大约五分之一可以通过了解他们的身高而得到,但同样高的人之间体重仍然存在差异。
图3.1 创建一个多基因指数。图表转载自Daniel W.Belsky and K.Paige Harden,“Phenotypic Annotation:Using Polygenic Scores to Translate Discoveries from Genome-Wide Association Studies from the Top Down,”Current Directions in Psychological Science 28,no.1 (February 2019):82·90,https://doi.org/10.1177/0963721418807729。个别SNP和表型之间的相关性是在具有大样本量的“发现GWAS”中估计的。许多GWAS的样本量多达数百万人。然后,对一个新人的DNA进行测量。这个人的基因组中的次等位基因(0、1或2)的数量被计算为每个SNP,得出的数字被GWAS对SNP和表型之间相关性的估计加权,产生一个多基因指数。这个多基因指数将呈正态分布:大多数人的多基因指数在平均水平,少数人的分数会非常低或非常高。经SAGE Publications,Inc.许可转载。
研究者在谈论R2值时使用的措辞可能会引起混淆和误导。有两个词特别容易造成麻烦。一个词是“解释”。R2值经常被称为“可解释方差”(variance explained),但在我看来,“解释”意味着对两件事情的关系有更深的理解。R2值并没有给出任何科学解释。它只是一个数学表达,表明一个变量与另一个变量共同出现的程度。
第二个制造麻烦的词是“预测”。在日常谈话过程中,当我们谈论“预测”天气、选举结果或股市活动的能力时,我们通常暗示这些对未来事件的预测是高度准确的。但研究者对未来事件的预测高度不确定且经常不准确时,他们也经常使用“预测”(predict)和“预测器”(predictor)这些词。在刚才举的身高和体重的例子中,我可以利用人们的身高信息,从统计层面说明人们体重的差异,也就是说,身高是体重的一个“预测器”。但实际上对于具体的人的体重,我仍然只能猜测。如果我知道他的身高,我的最佳猜测会比我没有掌握这个信息时更好。但即便如此,我的最佳猜测仍然会很糟糕,因为身高相同的人在体重上仍然会有很大的差异。
考虑到这些信息,多基因指数和教育结果的R2是多少?在生活在高收入国家的白人样本中,从受教育程度GWAS中创建的多基因指数,通常能捕捉到受教育年限、标准化学业考试成绩或智力测试分数等结果中10%—15%的差异。 注【A.G.Allegrini et al.,“Genomic Prediction of Cognitive Traits in Childhood and Adolescence,”Molecular Psychiatry 24,no.6 (June 2019):819–27,https://doi.org/10.1038/s41380-019-0394-4.】
10%—15%听起来是很多还是很少,在很大程度上取决于你的视角。根据我的经验,人们往往轻视10%的R2,认为它微不足道、可以忽略不计。当然,10%的R2值告诉我们,多基因指数不能“算命”,不能准确预测任何个体的未来。 注【Robert Plomin,Blueprint:How DNA Makes Us Who We Are (Cambridge,MA:MIT Press,2018).】 在图3.2中,我绘制了多基因指数和生活结果之间的假设关系图,其中前者捕获到了后者的大约10%的差异。如果你在横轴上选取任何一点,即选取多基因指数的任何给定值,然后向上和向下看,你会发现人们的生活结果仍有很大差异。这与我们在现实中看到的情况相吻合:在具有平均水平的教育多基因指数的人当中,有些人拥有博士学位,有些人没有从高中毕业,还有介于这两者之间的各种情况。
虽然多基因指数并非个人生活的完美“算命先生”,但我们也不能将其视为微不足道或可忽略不计。正如心理学家大卫·芬德和丹尼尔·奥泽认为的,我们可以通过将R2值与我们在日常生活中遇到的一些关系强度相比较,来直觉地判断R2值是“大”还是“小”, 注【David C.Funder and Daniel J.Ozer,“Evaluating E.ect Size in Psychological Research:Sense and Nonsense,”Advances in Methods and Practices in Psychological Science 2,no.2 (June 1,2019):156–68,https://doi.org/10.1177/2515245919847202.】 比如抗组胺药缓解过敏症状的趋势(R2=1%),男性比女性更重的趋势(R2=7%),海拔高的地方更冷的趋势(R2=12%),以及如前所述,高个子的人更重的趋势(R2=19%)。在这个清单中,我们可以添加一个与社会不平等研究特别相关的基准:出生在富裕家庭的孩子从大学毕业的比例更高(R2=11%)。 注 【Lee et al.,“Gene Discovery and Polygenic Prediction from a Genome-Wide Association Study of Educational Attainment in 1.1 Million Individuals.”】
对收入的比较尤其令人感慨,因为我们太习惯于思考金钱能给学生带来的好处。更富有的父母可以买更多的玩具和书,把孩子送到更好的学校,为孩子报名参加艺术课程和智能机器人课后项目。更富有的父母可以负担得起私人家教和SAT预科课程。来自富裕家庭的学生不必通过勤工俭学来完成大学学业,有更多时间可专注于学习。当然,在富裕家庭长大的孩子并不是注定(destined)会获得大学学位的。你的家庭经济状况并不能完全决定(determine)你成年后的社会阶层。但是,对于了解在美国谁最有可能获得大学教育,谁最不可能获得大学教育,金钱是很重要的。
图3.2 假设的多基因指数可以捕捉到生活结果中10%的差异。横轴为多基因指数;纵轴为假设的生活结果,如受教育程度。每个点代表一个人。对于多基因指数的每个值,人们的生活结果都有相当大的差异。
这些基准比较得出的数字可能比你想象的要小。芬德和奥泽在论文中指出了三个原因,以解释为什么R2值通常比我们预期的要低。首先,也是最简单的原因:人类彼此之间非常不同。有很多差异性需要解释。
第二,人类生活的因果关系很复杂,是多种因素相互作用的结果。鉴于潜在相关因素的数量之多,期望任何一个变量(即使是像收入或遗传这样重要的因素)能够解释结果中较大的差异,是不现实的。用芬德和奥泽的话说,“也许所有研究者都应该稍微(或大幅)降低他们的期望”。 注【Funder and Ozer,“Evaluating E.ect Size in Psychological Research.”】
最近一项名为“脆弱家庭挑战”(Fragile Families Challenge)的研究强调,研究者需要降低他们对任何变量的期望,无论是环境变量还是遗传变量。“脆弱家庭和儿童福祉研究”是一项正在进行的研究,研究对象是4000多个家庭,他们在孩子出生时被征集参加儿童发展研究。此后,这些孩子在1岁、3岁、5岁、9岁和15岁时接受了一系列变量的测量。他们的父母、老师,以及孩子们自己,都接受了调查,调查项目包括“儿童健康和发展、父亲和母亲的关系、父亲在养育中发挥的作用、婚姻态度、与大家族的关系、环境因素和政府项目、健康和健康行为、人口统计学特征、教育和就业及收入、父母的监督和亲子关系、父母对孩子施加的纪律、兄弟姐妹之间的关系、生活常规、学校、青少年犯罪、任务完成和行为,以及健康和安全”。 注atthew J.Salganik et al.,“Measuring the Predictability of Life Outcomes with a Scienti.c Mass Collaboration,”Proceedings of the National Academy of Sciences 117,no.15 (April 14,2020):8398–8403,https://doi.org/10.1073/pnas.1915006117.】 换句话说,就是研究者能想象得到的关于儿童环境和发展的一切。
就在研究者公布孩子们15岁时的测量数据之前,他们设计了一项挑战任务:让多个科学家团队使用尽可能多的变量和统计方法(只要他们想得到),来预测孩子们15岁时的结果。最终,超过160个科学家团队参与了这项挑战,每个团队都获得了关于一个孩子及其家庭的1.2万多个变量。结果很能令人清醒。最好的模型(它有可能包含自孩子出生以来被测量的成千上万个变量)只能预测学生15岁时成绩差异的20%。在描述这些结果时,“脆弱家庭挑战”的组织者附和了芬德和奥泽的呼吁,即在研究复杂的人类生活时,研究者应当保持谦逊:“如果用我们的预测能力来衡量我们的理解程度,那么研究结果……表明,我们对儿童发展和生命过程的理解实际上是相当贫乏的。” 注【Salganik et al.】
那么,任何关于遗传与人类生活结果的关联是“强”还是“弱”的讨论,都必须面对这样一个事实:当研究者在研究像儿童学业成绩这样复杂的东西时,即使研究者测量了他们能想象得到的环境的每一个方面,仍然没有一个变量或一组变量的R2值看起来令人印象深刻。
不过,即使是一个小的R2值,也可能是相当有意义的。芬德和奥泽解释为什么R2值往往比我们想象的要小的第三个理由是,当小的影响一次又一次地重复,在一个又一个人身上重复时,这些小的影响就会累积起来。我们习惯于考虑收入的微小但系统性的影响是如何累积的:在教育轨迹的每一点上,富裕的家庭都可以“作弊”,使他们的孩子更有可能获得某种结果,比如考试获得某个分数,或被分到“快班”,或被精英学校录取。这个过程乘以数以百万计的家庭,就形成了不可忽视的教育不平等的社会模式。因此,DNA也可能是儿童生活中的一种系统性力量,在教育轨迹的每一个点上都会有它的影响。而拥有某种遗传变异组合所赋予的优势,会在数百万人中累积,同样会导致不可忽视的教育不平等的模式。从长远来看,那些看起来很小的影响可能是有意义的。
在统计学层面,多基因评分能够同我们已经确信对研究社会不平等很重要的其他变量(如家庭收入)“竞争”,这改变了我对GWAS的价值的看法。知道一个名为rs11584700的SNP与在学校能够多待两天相关,可能并不特别有价值。但如果一个多基因指数对受教育程度的影响大到这种程度——多基因得分最高的学生和得分最低的学生之间在受教育程度上的差距跟最富有的学生和最贫穷的学生之间的差距一样大,那么这个多基因指数就是有价值的。正如我们在接下来的篇幅中将会看到的,这一进展为研究的可能性开辟了新的前景,并且势如雪崩地带来了大量新的阐释性问题。
在接下来的章节中,我将逐一处理这些阐释性问题。我将考虑这些多基因关联是否是因果关系(第五章和第六章),基因影响像教育这样复杂的事物的机制是什么(第七章),以及这些结果对我们改变人们教育轨迹的能力有什么影响(第八章)。
不过,在我们深入探讨这些问题之前,读者可能已经注意到,我描述的这些研究都是用那些被认定为白人的样本进行的。这些遗传学研究告诉我们的,是在种族同质化的人群内部的个体差异状况。与此同时,在教育结果或收入方面的一些最大差异,是在不同种族群体之间出现的。正如我在导言中提到的,如果认为我描述的遗传学结论为我们提供了关于群体间差异原因的任何信息,那将是一个严重的错误。但是为什么?在下一章,我们将考虑这个问题。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.