五千年(敝帚自珍)

主题:354-Robert Plomin:基因与成绩 -- 万年看客

共:💬5 🌺10
全看分页树展 · 主题
家园 354-Robert Plomin:基因与成绩

https://www.youtube.com/watch?v=-k41lteal1M&list=PL4i9YSoIJiPeWWDfOimNzy08bFl_pX8Zl&index=49

How DNA Makes Us Who We Are | Robert Plomin | Talks at Google

……当我在二十世纪七十年代初开始研究生学习时,你们可能很难相信那时候就算谈一谈遗传学都很危险。当时心理学领域的主导理论是环境主义——我们当时学得就是这套观点——以至于提起遗传学不仅会危及你的职业,甚至还会影响你的个人生活。当时的教科书甚至主张精神分裂症是由母亲在子女生命的前三年对其所做的事情引起的。从那时起,大量证据说服了大部分科学家相信遗传学在人类行为的许多方面都起到了主要作用。今天我想专注于人类行为的一个方面,也就是学校成绩。我这样做的部分原因在于接下来的内容源自我在星期六的《新科学家直播》当中做的演讲,直接拿来比较省事。

你们认为什么因素会影响学生在学校的表现?我们很容易想到具体的环境因素,比如父母、老师和学校。但是我想说服你们相信,某些无形因素——比如DNA——才是导致孩子们在学校表现差异的主要原因。环境也很重要,但是环境的作用方式与我们在考虑遗传学之前所设想的方式非常不同。以往关于环境的研究往往理不清头绪,因为家族当中出现的现象可能出于先天因素——遗传——而不仅仅是后天因素。但是如果你们忽视先天因素,假设后天因素决定一切,你在思考环境影响行为的方式时就会得出非常错误的结论。伴随着DNA革命,这方面的研究正在变得越发干系重大。我会尽量快速完成我的讲座的前半部分,以便花更多时间讨论DNA革命。

画面上是我的新书《基因蓝图》,很抱歉企鹅出版社没能及时把样书给你们送过来。我想等到我的讲座结束之后肯定就能送来了。这本书的前半部分讲得都是基因学内容——我们是怎么知道遗传学如此重要的?通过遗传敏感的实验设计来研究环境因素让我们学到了什么?以及这些研究成果意味着什么?我今天不讨论精神障碍之类的心理疾病,也不讨论人格与性格的养成。我今天仅仅讨论这个庞大领域的一个方面,也就是学校成绩。讲座与新书的第二部分则是关于DNA革命——如何识别导致行为差异的具体DNA差异。这方面的研究将会改变一切,所以我认为非常重要。我写这本书的原因正是为了表明我们真的需要讨论许多正在发生的研究进展。

首先我们要讲解一下术语。遗传学与遗传性这样的概念对于人们来说很难理解。但是假如你问人们,眼睛颜色的遗传性有多高——眼睛颜色在多大程度上由遗传DNA差异造成——根据我做过的调查,平均来说人们认为眼睛颜色的遗传性达到了90%,这意味着眼睛颜色几乎完全由遗传差异造成。但是一旦转向复杂性状——比如体重——人们的答案就变了。大家认为体重的遗传性大约是多少?一般公众会说大约在20%到30%之间。他们认为体重可能会受到一点遗传影响,但是环境因素起到了主要作用。但是实际上,包括DNA研究在内的广泛研究表明体重的遗传性足足有70%。这一点非常重要,因为这意味着在座各位的体身材差异——你们所有人似乎都很苗条,除了我——主要源自遗传差异。这样的认识对于我们这个惯于肥胖指责与肥胖羞辱的社会关系重大。我们需要认识到,像我这样的人增重要比你们这些瘦人更容易,而减肥则要困难得多。接下来一旦谈到学校成绩,人们更是惯于严重低估遗传影响。他们认为遗传因素可能有一点遗传但是不多,因为成绩意味着通过努力得到的东西。与成绩相对的是能力,这才是由遗传决定的。但是实际上在英格兰学校进行的测试表明,考试成绩的遗传性大约有60%,这意味着60%的孩子的成绩差异由遗传差异造成。我们往往假设成绩差异完全由环境造成,完全取决于孩子上的是什么学校、父母下了多大气力来敦促孩子学习。但是父母对于子女成绩的掌控力实际上远远没有他们自以为的那么大。这是我想传达的关键信息。

遗传学当中最被误解的概念就是遗传性/heritability,因此有必要先花一点时间讨论这个概念。我们想要考察的是让人与人不一样的原因——为什么有些人比其他人更胖?为什么有些人在学校的表现得比其他人更好?在我们的DNA双螺旋当中有30亿对碱基,其中超过99%的碱基对于每个人都一样,只有1%不一样。99%是让我们成为人类的部分,1%是让我们成为独一无二的人的部分。我们关心的是,每个人都不同的这1%基因会为诸如学校成绩之类的性状带来怎样的差异。我们仅仅打算描述现实而不是可能性,所以我们在有代表性的英格兰样本当中开展了针对双胞胎与收养儿童的DNA研究。以体重为例,考虑到当前的遗传差异和环境差异,遗传差异会产生多大的影响?如果更换研究环境、研究时段以及研究对象,那么结果很可能会不同。但是这个结果仍然是对于研究环境敏感的良好描述性统计结果。

其次,我们仅仅描述正常范围内的变异,我们不能在研究描述的样本范围之外进行概括。我们研究的样本可能代表了95%的人口,但是不包括例如父母虐待子女的家庭——话又说回来,那些人也不会主动报名参与研究——也不包括那些由于基因突变而造成的极端遗传案例——这些遗传病的后果非常严重,足以毁灭一个家庭,但是的确非常非常罕见,发病率仅为十万分之一到二十万分之一。因此如果你的样本包含几万人,这些极端情况并不会出现在样本当中。

最后我想强调的是,我们讨论的是遗传影响,是倾向性与概率性因素,而不是先天的、不可改变的或决定性的因素。一般人讨论遗传学的时候总是惯于认为讨论仅限于先天的、不可改变的影响。对于单基因疾病情况确实如此,而且大多数人学习遗传学的入门内容也确实是孟德尔的单基因性状实验。确实存在成千上万的单基因疾病,尽管非常罕见。如果你的4号染色体上有亨廷顿病的等位基因,那么你肯定会死于亨廷顿病。这是基因的硬性规定,无论你处于怎样的环境都无关紧要。问题在于当我们谈论复杂性状时——不仅包括心理性状——社会上大部分医疗负担都是由常见疾病造成的,这些疾病并非由单个基因引起。它们在遗传层面受到许多微小基因效应的影响。这使得它们的影响是概率性的而非决定性的。一般人往往很难理解这一步跨越。

我们在过去一百年间一直在借助双胞胎来研究遗传因素的影响程度。双胞胎分为两种类型。1%的新生儿是双胞胎,其中三分之一是单卵双胞胎或者说单合子双胞胎,既一个受精卵在受精之后的头几天由于未知原因分成两个。这两个双胞胎是彼此的克隆体。如果你对他们的DNA进行测序,就会发现他们在遗传上完全相同。其余三分之二的双胞胎就像任何一对同时出生的兄弟姐妹,他们的母亲在怀孕时有两个卵子同时受精,因此他们有50%的基因相同。基于以上事实,我们可以针对任何受遗传影响的性状进行预测,比如学校成绩。你可以预测单卵双胞胎的成绩的相似度会高于异卵双胞胎。然后你还可以利用这种相似度来估计遗传性。1994年,我来到英国开始了双胞胎早期发育研究,这是全球规模最大的双胞胎发展研究。我们的研究大约覆盖了15000对双胞胎,从小到大对他们进行了14次研究,最近一次是在他们22岁的时候。至今仍然有大约10000对双胞胎还在参与这个项目。重要的是,正如我稍后将提到的,我们还收集了他们的DNA。多亏了他们,我将要谈到的几项DNA分析才得以开拓先河。我很喜欢研究以前没有受到太多关注的事物,例如幼儿阶段的语言能力发育或者在幼儿过程中出现的行为问题——比如注意力缺陷——这些方面在早期儿童时期遗传性很高。但是由于我对认知发展尤其感兴趣,当他们进入学龄时期时我真的很想研究认知能力的实际体现,也就是成绩。

画面上的图表总结涵盖了双胞胎早期发展研究十五年来的成果。这张柱状图是根据单卵双胞胎和异卵双胞胎的成绩与基因的相关性得出的遗传性估计,涵盖了一名学生的所有关键年龄——读小学一年级的7岁、9岁、12岁、要考GCSE的16岁以及要考A Levels的18岁。可以看到,在所有年龄段,成绩的平均遗传性都超过60%,包括一年级。很多人可能会认为在一年级时学生的表现更多是父母行为的结果,但是实际上一年级的成绩受到基因影响的程度就像GCSE或者A Levels一样大。在行为科学当中,某个因素要是能够解释5%的方差就堪称影响力巨大,要是能解释60%的方差——即人们之间的差异——那简直不可思议。

我们的研究发发不仅仅局限于双胞胎,还有许多其他方法可用。如果说双胞胎方法就像生物实验,那么收养方法就像社会实验。一般家庭的成员之间不仅共享基因,还共享环境——又说到了先天与后天的问题。我们一直知道一切都与家庭有关。成绩优秀的父母往往会有同样优秀的孩子。几十年来人们一直认为显然这是因为父母教育的好,这些父母为他们的孩子提供了更好的环境。但是一旦开始考虑遗传学,那么你难免会问:既然子女与父母有50%的基因相同,那么成绩的相似性是否有可能在很大程度上源自先天因素而不仅仅是后天因素?收养方法可以回答这个问题。一方面,这种方法需要研究被送养的子女和他们的生物学父母之间的成绩差异——这些父母对于子女只有先天影响,没有后天影响;另一方面,这种方法还需要研究被收养子女与养父母之间的成绩差异——这些父母对于子女只有后天影响,没有先天影响。因此我的书还描述了一项我进行了四十年的研究,名叫“科罗拉多收养项目”,涉及约250个收养家庭。我们获得了关于生父母、养父母和被收养孩子的数据,来自从婴儿期到成年期的纵向研究。我们同时还研究了相对应的非收养家庭,或者说父母与子女共享基因与环境的家庭。

一般学习能力——我们称之为g以免使用“智力”这个词,因为某些人一看见这个词就像斗牛看见红布那样火冒三丈——指得是通用的认知能力构造。这个性状比较容易测量,所以请不要像膝跳反射那样一听到这个词就反应激烈。长期以来我们都知道一般学习能力会在家庭内部传承。随着孩子的成长,父母和孩子越来越相像。在父母与孩子共享基因和环境的情况下,到了青春期晚期,父母与子女的一般学习能力的相关性达到了大约0.3。那么这种相关性的根源是先天因素还是后天因素?很长一段时间里我们都假设是后天因素,而且这个假设并非不合理。但是如果根源在于后天因素,或者说在于父母为孩子提供的、影响认知能力发展的环境,那么养父母与养子女的一般学习能力的相关性也应该大约是0.3。可是实际统计结果却表明这个数字是零。这表明这一相关性并不像我们认为的那样源自后天因素——或者说父母的行为造成的系统性效应。那么这一相关性莫非完全基于先天因素吗?将子女送养出去,因此与子女不共享环境、只共享基因的生父母与子女的相关性又如何?答案是略高于0.3。这一结果不仅有力地证明了先天因素多么重要,而且还同样有力地证明了我们所定义的后天因素——家庭环境造成的系统效应——多么不重要。当然,家庭环境依然很重要,因为一般学习能力的遗传性并不是100%。平均来说更接近50%。但是这里所谓的“家庭环境”其实是某种自从弗洛伊德以来谁也没想过的、非常不同于我们的惯用定义的环境。

我赶紧说一下上述研究的结论,因为我想尽快讨论分子遗传学。我的书的前半部分讨论了我们如何知道遗传学很重要以及究竟多么重要,但是这些研究的第二项重要发现在于遗传因素得到控制之后环境因素发挥的作用。我刚刚提到环境效应很重要,但是这里所说的环境并不是一般意义上的系统环境效应。同一个收养家庭里的不同子女——约有三分之一的收养家庭会再收养第二个孩子,他们彼此之间显然没有遗传关系——各方面性状的相关性为零,而那些一起长大并且共享基因的亲生手足的相关性则十分显著——人格相关性为0.2,认知发展相关性为0.3。在过去三十年里,人们一直在努力找出是什么神秘因素造成了一个家庭里两个孩子的彼此差异。原因可能有很多,比如意外、疾病、不同的玩伴,或者父母对待他们的不同方式。但是三十年的研究没有发现任何系统性因素。因此我得出结论,称之为“黑暗假说”:我认为造成这些差异的影响本质上是独特且随机的,简单来说就是偶然。比尔·克林顿在他的自传当中说过他为何会从政。据他所说是因为在十六岁那年他与肯尼迪握过手。这就是偶然现象的好例子。像这样的偶发事件并不是容易测量的系统性变量。而且考虑到克林顿的撒谎劣迹,此事也未必属实。但是特有经历的重要性确实不可忽视。你为什么成为了今天的你?就我个人而言完全是因为一系列偶然事件。无数个朝着这边或者那边推动你的小推力最终滚雪球似的造成了很大的变化。

以上是我们所谓的非共享环境,或者说在同一个家庭成长、上同一所学校的不同孩子们各自独自经历的环境。接下来是第三项关于先天与后天因素的发现:看似系统的环境效应实际上要由基因介导。大家都知道相关性并不意味着因果性,但是如果你每周在报纸上看到关于相关性的报道——父母这样做,孩子就会变成那样,父母给孩子朗读,孩子在上学时就更擅长阅读——那么你很难忍住不用环境因素来解释这些现象。但是相关性并不意味着因果性。别忘了父母与子女共享50%的基因,换句话说爱阅读的父母或许并非养成了爱阅读的孩子,而是生下了爱阅读的孩子。越来越多的研究发现表明,相关性确实存在,但是作用方向却与我们的惯常认知相反:并不是父母的行为造成了子女的差异,而是子女的差异促使父母采取相应的行为来应对,作为一名有六个孙辈的祖父,我本人对此深有体会。一个孙女愿意让我整天给她读书。她喜欢文字和阅读。但是我的大孙女却不想读书。她想踢足球,想出去玩。如果我说“不行,你是我孙女,我是你爷爷,你就坐在这里听我给你读书,这就是你的本分”,那几乎等于虐待儿童。父母的行为是针对子女差异做出的应对——仔细想想本来就应该是这样。在教育方面我们也应该认识到孩子之间的差异,努力弥补他们的弱点,放大他们的优势。

把这三件事结合在一起,就构成了我的新书标题,虽然我承认这个标题有意挑衅并且容易引起误解。我想说的是,DNA是塑造我们的个体特征的主要系统性力量,环境因素虽然重要但却并不系统。假设你有一个克隆体,你的克隆体在并非你母亲的另一位女性的子宫当中孕育,成长在另一个家庭,有不同的父母,上不同的学校,交不同的朋友,找不同的工作。但是这个克隆体依然会在很多方面将与你现在的自己非常相似,不仅在成绩方面,甚至还包括个性与心理障碍等等方面。事实上,那个克隆体与你的相似性将会不亚于与你一起长大的同卵双胞胎。同卵双胞胎之间的成绩的相关性大约为0.7。分开抚养并不会使他们之间变得不那么相似。这就是先天因素的重要性——以及系统性家庭环境的不重要性。而且上述内容不仅仅是拍脑袋的假想。

我不知道你们认不认识画面上这个人,不认识的话等会儿你们就认识了。他名叫鲍比,在长岛的一个富裕家庭长大。他在纽约州北部某大学上学。入学第一天大家看见他都喊他“埃迪”,女生们走上前来跟他拥抱:“哦,埃迪,见到你真好。”他一开始还以为自己一不小心成为了心理学实验的对象,四处寻找隐藏摄像机。但是接下来他当真见到了埃迪。两人很快就发现他们生于同年同月同日,通过同一个纽约收养机构被送养到了不同的人家。这起事件引发了公众关注,随即导致了出乎意料的转折:却原来鲍比与埃迪不是同卵双胞胎,而是同卵三胞胎,三兄弟当中的第三人看到新闻报道之后也站了出来。我刚才说过,合子会出于未知原因而分裂,有时其中一个合子又会再次分裂。总而言之,这三兄弟是彼此的克隆体,拥有相同的DNA序列。关于这起事件的纪录片去年获得了圣丹尼斯奖,名叫《孪生陌生人》,如今可以在流媒体上观看。我强烈推荐这部电影,因为它生动表明了我试图阐述的观点。顺便说一句,只需观看前半部分就行,因为后半部分看得人心里堵得慌。你有没有想过,为什么这三兄弟会被从小分开并且不知道彼此的存在?为什么其中一个被送到下层家庭,另一个被送到中产家庭,第三个又被送到上流家庭?罪魁祸首是一个古怪的精神病学家,为了证明后天因素的重要性,他做了一个在他看来足以一锤定音的实验:将三个同卵三胞胎分别送进低阶家庭、中阶家庭以及高阶家庭。这三个家庭此前都已经收养了一个孩子,因此在收养机构供职的精神病学家很清楚各个家庭的养育方式。这位专家是一个弗洛伊德主义者,实验开始时又是二十世纪五十年代。因此他原以为后天因素将会决定一切。当他发现实验结果打了他的脸之后,他随即将这些结果藏了起来。这项实验的研究结果从未发表,而是锁在耶鲁医学院的保险箱里,直到2066年才能打开。根据影片的揭露,由于这个原因被分开的同卵双胞胎至少还有六对,甚至更多。

上述案例只是个例,但是背后确实存在双胞胎研究的大量数据。我在瑞典做了一项研究,涉及超过100对分开抚养的同卵双胞胎以及其他收养设计,比如生父母和送养子女,同为被收养子女的手足,分开收养的亲生手足,等等。DNA在这些研究当中的重要性正在与日俱增。你甚至可以在没有亲缘关系的个体之间使用DNA来估计遗传性——解释这一点可能会花费太长时间,但这确实是全新新的热门领域。总之这些研究的结果全都趋向于我提到的结论。需要强调的是,这个结论并不必然具有政策含义。老旧的观点认为政策既依赖于知识也依赖于价值观,如今我对于这种说法越发不以为然。如今我相信基于知识的决策要比不基于知识的政策更好。当然,如果你的数据和研究符合政府的价值观,政府会很乐意使用他们,但是这样的数据并没有为政策提供多少信息。不过关于学校政策,我的主张确实引起了些许关注。我不知道你们能否看懂这个主张是什么意思:学校很重要,但是学校无法带来改变。学校非常重要,因为孩子们必须学习基本的读写技能与数学技能并且接受社会化;但是学校并没有带来实质性的差异。上同一所学校的孩子与去不同学校的孩子之间的相似度并不更高。部分原因在于60%的个体差异是基因造成的,而环境效应不是系统性的。

有一个事实对于你们这样看起来正处于生育年龄的群体十分重要:英国有一套堪称疯狂的中学择校体系,父母往往花费数十万英镑好将他们的孩子送进更好的学校——为什么?大多数家长的择校标准都是学校的OFSTED评级,但是人们却不去质疑OFSTED评级的效应究竟有多大。评级的标准包括校园环境、师资力量、校园霸凌管控等等,它们也是影响学校排名表的主要因素。问题在于,孩子们的GCSE分数差异能够在多大程度上通过OFSTED对于学校的评分来解释?一些孩子就读于评分非常高的学校,而一些孩子则在评分很低的学校就读。根据统计结果,遗传性占60%,而OFSTED评分仅占4%,后者并不算显著。这还仅仅只是平均差,此外你还必须考虑效应值。OFSTED评分的效应值非常小。如果考虑到家庭社会经济地位的影响——孩子们并非被随机分配到高评分学校,而是被有钱的父母塞进去的——OFSTED评分对于GCSE分数差异的解释力干脆下降到了1%。这点差异你甚至无法凭借日常经验察觉出来,而是需要非常大的样本与大量统计数据才能检测出这点差异。最后,看似来自学校体系的影响实际上往往是披着伪装的遗传影响。

举个例子,你们可能知道选择性学校与非选择性学校的学生之间的GCSE成绩平均而言差了整整一个等级,看起来选择性学校与GCSE成绩之间确实有相关性。我们很难不把这种差异解读为环境因素,毕竟选择性学校确实拥有更多的资源、更好的运动场,可能还有更好的教师。但是相关性不等于因果性。选择性学校的学生之所以GCSE分数更高,实际上是因为选择性学校会根据成绩与能力来挑选学生,而成绩与能力特质又会受到遗传因素的影响,于是就形成了自我实现的预言。中学挑选了那些在小学表现最好、能力最强的孩子,这些孩子在中学的表现自然会更好。如果你根据选择性学校的招生标准——学生此前的成绩和能力——来矫正学生们的GCSE分数,就会发现选择性学校学生们的GCSE分数与入学成绩的比值与非选择性学校的同学们差不多。换句话说选择性学校并没有为学生成绩带来额外的提升。

很多父母会说,至少在他们看来花大钱择校的原因并不是仅仅为了提高孩子的成绩,而是为了让孩子从小培养人脉。毕竟,英国一半的法官来自排名前7%的选择性学校。也许选择性学校的学生走上社会之后确实门路更广。但是如果仅仅考虑成绩,证据已经表明了选择性学校无法影响学生的成绩。或许选择性学校的环境更好一点,不过哪怕关于这一点我都并不完全信服。高排名学校的学生自残情况更为严重。我的一个孙子最近就承受了很大的压力,因为我儿子想把他送进一所选择性学校——每年的学费将近三万英镑——尽管这孩子现在就读于一所很不错的综合学校。我能说什么呢?我坚决抵制这个决定,因为我不相信这样做能带来多大好处。像他这样的孩子在他现在的学校里是一颗明星,但是当这些孩子进入压力山大的选择性学校之后,能够达到平均水平就不错了,更何况如果他们在预考当中表现不佳就会被开除。我认为这是一种疯狂且高压的教育体系,摧毁了学习的乐趣。所以我主张我们需要改换看待教育的方式,将遗传因素纳入考量。大多数情况下,孩子们总会选择、修改以及创造适宜自己的环境,而这些行为又与他们的遗传倾向相关。在同一个课堂听课的孩子往往因为遗传倾向不同而体验到不同的环境。我们需要从被动的强加教育模式转变过来。

教育/instruction这个词的拉丁文原意是“塞入”,这也是我们通常的理解方式:上学就是要把国家审定的课程“塞入”学生的脑海。相反,我们需要转向积极的环境构建模式,在这种模式下孩子们将会选择适合他们倾向的环境。说句不好听的话,并不是每个人都需要掌握高等数学。我们需要考虑孩子们擅长什么,放大他们的优势,消减他们的弱势,让他们学会学习,因为众所周知——我不知道这话是否正确,反正大家都这么说——今天处于义务教育阶段的孩子将来会从事现在还不存在的工作,因此他们必须学会学习。这里指的不是学习特定技能,而是将学习本身当成一门技能。最重要的是他们需要享受学习。但是我们目前以应试为纲的高风险考试文化确实摧毁了任何形式的学习乐趣。

以上就是我过去三十五年研究的一部分,哪怕研究到此为止我也依然会感到心满意足。但是DNA革命来了。正如我所说,我认为这场革命将会改变一切,它将允许我们仅仅通过DNA就在一个人刚出生时预测他这辈子具有怎样的潜力,可能遭遇怎样的问题,因为DNA在一生当中不会改变。这样一来我们就可以提前采取措施,不必等到问题出现之后才犯愁。比方说我们不必等到孩子上学之后才发现他们不擅长阅读。预防理应是更好的选择,这也正是整个医学领域的发展方向。我们不再等到人们心脏病发作再治病,因为我们不太擅长事后解决问题——例如肥胖、酗酒或者精神分裂症。预测问题,进行干预,预防问题,这样做要容易得多。科学正在经历真正的变革。几乎所有的大型研究现在都包含了DNA因素。而且DNA革命也将会改变社会、养育方式以及教育——我的下一本书的主题就是亲子遗传学——还会改变我们对自己的理解。这本书的最后部分包含了世界上第一套心理特质多基因谱系。我在体重指数方面处于第94百分位数意味着什么?人们会说“那你就放弃吧,基因决定了你只能是个胖子。”但是我知道事实并非如此,这一点实际上意味着我必须改变身边的环境,让自己不容易接触到垃圾食品。总之了解DNA革命十分重要,接下来我要详细讲一讲。不过面对你们这样的听众,我就算多讨论一点技术性内容想必也不用担心你们跟不上。

第一步是获取DNA。如果你做过任何直接面向消费者的测试——例如http://ancestry.com与23andMe——你只需冲着试管吐口唾沫就行。实际上你可以从你身体里的任何细胞获取DNA,因为你可能没有意识到一个了不起的事实,在你以单细胞形式开始生命之前,你的一半DNA来自你的母亲,另一半来自你的父亲,这套独特的DNA在你体内的每个细胞当中都是相同的,而你的你细胞足有数万亿个。唾液含有从你嘴里内侧脱落下来的细胞,而且现在我们只需要一个细胞就能测量DNA。哪怕你只是喝了一杯水,军情五处也可以通过你在杯缘留下的细胞获取你的DNA。一旦得到DNA,我们就可以针对DNA进行基因分型。正如我所说,人与人之间只有1%的DNA不一样。最常见的DNA差异叫做SNP——单核苷酸多态性。多态性指得是差异,核苷酸指得是DNA的碱基,也就是A、C、T、G这四个DNA字母。画面上展示了两条染色体,这两条染色体的碱基几乎完全相同,就差一个。有些人在这个位置上的碱基字母是T,另一些人是C,这些被称为等位基因。一旦我们发现了这样的差异,就可以简单地将其与性状相关联,比如学业成绩。在遗传学中他们称之为关联,说白了就是某人的性状与零个C、一个C或者两个C等等情况的相关性。

以下是采用某种新技术发现的第一个SNP,发表在《科学》期刊上。待会儿我再跟大家详细解释以下这种技术,现在我先给你们展示一下SNP的真正样子。画面上就是这个SNP——我们人类在染色体上的一个特定位点上曾经都是TT,然后某个人出现了突变。DNA复制通常来说非常可靠,但是DNA包含三十亿个碱基对,每当有细胞分裂都要全部复制一遍,因此偶尔也会出现一些偏差。总之这位某人再这个位点的碱基组合是AT而不是TT——其实也可以是CT或者GT,但是他的变异结果就是AT。这一突变迅速传播,特别是在欧洲人群当中,因为它有助于身体储存脂肪。在石器时代存储脂肪的能力很有用,但是在一个快餐盛行的世界里就不是好事了。如今40%的人类拥有A等位基因。如果你有两个A等位基因——比方说我本人——那么平均来说你的体重要比没有A等位基因的人重六磅,比拥有一个A等位基因的人重三磅。这就是我们所说的关联:零个、一个或两个A等位基因与体重指数这个性状之间的相关性。

如今改变一切的技术进步被称为SNP芯片。这是一个邮票大小的DNA阵列,由合成的DNA片段组成,每一款芯片的设计制造都针对一个特定的SNP。首先将受检测的DNA加热到高温,使其分成两股——DNA不喜欢分开,单股DNA总想找到自己的另一半。然后我们把单股DNA切碎,在这些DNA片段上加上荧光标签,然后将它们铺在上面含有数百万个SNP探针的板上。如果被检测的碎片当中具有正确的SNP,它就会与探针上的合成DNA杂交;如果等位基因错了,那就无法杂交。这样一来板上会呈现荧光信号,用来表明你是否拥有特定的等位基因。如果信号暗淡,说明你没有等位基因;如果光亮一般,说明你有一个等位基因;如果信号强烈,说明你有两个等位基因。通过这种方式我们可以成本极低地研究数百万个SNP。起初这项技术的费用高达数千英镑,而现在在这块小芯片上检测数百万个SNP的实际费用仅为40英镑。这项技术非常可靠,是一项了不起的技术进步,彻底改变了生命科学领域。现在我们不仅能将一个SNP与一个性状相关联,还可以将数百万个SNP与一个性状相关联。而且这种方法完全不需要理论先行。过去我们首先挑选几个候选基因——比如血清素基因——假设这些基因对于抑郁症很重要,然后再确定我们的假设对不对。这是一条死胡同。相反,无理论的方法同时观察全基因组当中的数百万个SNP,看看是否有任何基因与某个性状相关联。这一做法被称为全基因组关联研究。

下面这项实验改变了我的职业生涯。去年我们进行了一项关于学习成绩的全基因组关联研究,样本量超过一百万人。这项研究的重要性在于它能够检测出非常微小的差异。早期的研究之所以不成功,是因为它们没有足够的能力去检测微小效应。人们都认为遗传性由少数几种具有重大影响的基因决定,但是我们从未找到这些基因。相反,这项研究以及整个生命科学领域发现,大量微小效应的叠加同样可以决定性状。画面上这张柱状图展示了经过千万次多重检验修正的全基因组显著性。横轴是从1号到22号染色体,纵轴是染色体上各个基因与成绩的相关性,通过以10为底数取对数来体现。构成立柱的每个点都代表一个SNP。在染色体上位置相近的SNP相互关联,因此它们也应该与性状相关联。每根立柱的峰值代表了该染色体上的基因与性状的最显著关联性,但是关键在于足有几千个SNP与这个性状——也就是学习成绩,在这项实验当中用受教育年限来表示——具有或多或少的相关性。这对于整个生命科学领域都堪称重大发现——就学习成绩而言,不存在单一的重大基因效应。我之前提到与体重指数相关的SNP,人们认为它的影响微不足道——只占方差的1%——结果发现它确实具有较大影响。大多数效应要小得多,这意味着需要巨大的样本来检测这些效应。但是面对这么多微小的效应,你该如何使用它们呢?

如果你想研究基因-大脑-行为这条路径,那么祝你好运,因为这些效应实在太微小了,很难观察。但是我对于预测行为更感兴趣,预测方法就是将这些SNP的效应相加,就像在天平上不断添加砝码一样。你必须将它们朝着正确的方向加权,根据它们与性状的关联效应大小来加权,因为某些SNP的相关性更大,但是归根结底不过是做加法而已。这就是全基因组多基因评分。这种方法正在改变一切,因为它100%可靠、公正且便宜。不同于我们掌握的其他任何预测方法,多基因评分可以从某人出生时就进行预测,不必等到晚些时候。医学与精神病学领域的大部分预防手段都是越早采用效果越好——就连肥胖也不例外——但是我们此前无法进行早期预测,现在我们可以了。多基因评分是少数几种确实在有限意义上意味着因果关系的相关关系之一,因为在这方面不存在反向因果关系——无论如何都只有基因影响性状,没有性状反过来影响基因的可能。你继承了你现在这套DNA序列,任何因素都改变不了这一点。你们要是问我要不要考虑表观遗传学以及基因表达的作用,那么我承认SNP确实必须得到表达才能起效。但是如果统计结果表明这些SNP与学习成绩之类的性状相关联,那么就意味着不管怎样它们已经得到了表达,我们并不需要了解哪些通路实现了这样的表达,反正没有任何行为、环境或者大脑因素能够改变一个人的DNA序列。

十年前人们担心基因检测可能带来意想不到的社会问题,不过例如23andMe、ancestry.com这样的直接面向消费者的基因检测公司还是纷纷冒了出来。已有2500万人自掏腰包进行了检测。大多数人进行检测要么为了了解自己是否患有单一基因疾病,要么因为他们很想追溯自己的祖先世系。你可能以为你了解自己的祖谱,但是其实你并不了解。我们都是杂交种,来自世界各地,有很多我们以前不知道的亲戚。在这方面有许多很棒的故事。我上个月看了一部BBC纪录片,讲述了一群捐精手足的故事——所谓捐精手足就是由同一位捐精者的精子授孕而生的人们。片中的捐精手足们直到十八岁才发现了自己身世的真相:却原来当初有一位捐精者的精子授孕了65位子女,这些同父异母的子女们全都不知道彼此的存在。这些公司现在还没有开展多基因评分,不过这却正是目前的重大商机,他们都在努力追逐这一目标。本周刚刚成立的一家公司就试图售卖多基因评分。23andMe暂时不会涉足这块业务,因为他们出于某些原因遭到了食药局的惩罚。目前23andMe可以进行的业务是基因测序,你可以从他们这里下载你的全套基因型,再上传给其他公司,由其他公司为你提供多基因评分。

通宝推:大眼,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河