五千年(敝帚自珍)

主题:【原创】你凭什么让我们的祖宗东奔西走颠簸流离 -- 老顽童

共:💬20 🌺21
全看分页树展 · 主题 跟帖
家园 在一个物种力,一般来说,一个基因有一个基因的固定位置

叫做它的座位(locus),物理上就是在一个特定的染色体上的特定位置,是不会怎么大动的。(一个染色单体就像一个线性的存储器,除了结构相关的部分,就是线性的信息序列)。每个人有23对染色体,每对都是父亲给一条dna母亲给一条dna,精子和卵子形成的时候,来自父母双方的dna会并到一起,随机交换相应的位置。因为相同的基因一般在相同的座位上,所以原地一换,每条dna上就携带了来自父母的基因的不同组合,而这些组合又组成一整套必须的人类基因组。这是造成龙生九子,九子不同的主要原因。

在一些物种里,也发现有少数的dna片段在整个基因组里到处跳,这叫转座子。不过在高等生物里,那个好像一般不看作正常的成分,而是当作病毒一类东西看待。研究遗传的时候,用的基因都是在比较稳定的位置上,而且不是可有可无,可多可少的那种。

另外,好像您对基因组的理解不大对。一个基因组,genome,就是一个个体的整套基因的集合,没有人会有40万个基因组的,呵呵。比如说,酵母的基因组大概有6000个基因,人的我忘了,好像10万个基因左右。

这些人做亲缘分析,一般也就取大家都有的一段必须基因,比如核糖体rna基因,或者什么代谢必须的酶的基因,或者什么都不编码,但是大家都有的片段,测个序列,一般都测上几千到几万碱基对(一个碱基对的信息量是2bit),然后跟来自别的个体的同一片段的序列对比,建立相似树,根据这个相似性来说您郡望何处。从这个公司100美元的收费看,估计也就给你做两三个测序反应(通常的技术,一个反应最多读1千碱基对),这个成本估计20块左右,然后给你比对序列的差异,也就是看这两三千个碱基对(2×bp bit的信息量)携带的差异。其实这么点信息量,又是光取样有限的几个小区域,未必能准。另取别的一段基因,也许结论就大不相同。反正您也没地方查去,图个乐呗。

此外他们的模型可能是亲缘树,也就是假设人的祖先很少交叉,总是分叉,是一个树状结构。但是我们都知道,如果没有生殖隔离的话,人的亲缘关系肯定是网状的,不是树状的,因为人是有性生殖的,不是分裂生殖的。所以他们这个结果看看玩玩也就可以了,不能太当真。

其实别说精确到人,就算精确到整个人类的系统发生,还很值得探讨呢,一会说人的祖宗是露西,一会又来什么非洲古人兵分两路。现在的主要问题是测一个人的基因组是要花很多钱很多时间的,短期内还不可能迅速的把一个人的整个基因组给测序,就算测几十分之一,几百分之一都搞不起,往往只能像上面说的那样,测很小的一段,所以每个样本的信息本身就是片面的。整个人类基因组计划,好像也就几十个人的样本吧。哪天能说揪出一个人来,立马就能把他哪条染色体的全序列拿出来,那样,人类的医学就该革命了。另一方面,世界上有60多亿人,就算每个人按现在的水平那样只测一小段,就测一下,要把每个地球人全测了也不可能。就算用抽样的办法,也还是搞不起,肯定有很严重的漏网现象。用这样的数据搞统计,就是用有限的墨水画大画,看到的现象是真的还是假的,在有更全面的统计结果前,谁也说不清。而现在的条件还就是这样,所以那些结论肯定会不断的被新结果修正的。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河