主题:翻译一篇分子进化的文献 -- 空格
目前讨论的方法都假定所有的氨基酸位点是受同样的选择压力、并具有同样的omega比率的。这一检测有效地在所有位点间进行了omega比率的平均,这样一来,只有在平均的值大于1时才会检测到正选择。显然,这种和方法是一种非常保守的检测正选择的方法。因为序列受其功能的约束,其中很可能大量的位点受强烈的纯化选择作用,因而其omega值是非常接近0的。
一些较近的研究解决了这个问题,Fitch及其同伙( ;),多有得罪)[33,34]用简约法重建祖先DNA序列,并统计了进化树的树枝上每个密码子位点上的取代。他们检测的是,是否在每个位点上非同义取代占的比例比序列中所有位点上的均值更大。Suzuki 和 Gojobori[35]采用了更为系统化的方式。对序列中的每个位点,他们估计了重构的树上同义和非同义位点的数目,使用的是重建的祖先序列,然后再检测是否非同义取代的比例与中性理论的期望值有不同(omega=1)。他们的这套方法比Fitch的方法更为严格,因为omega的比率在所有位点间的平均总是接近1的。这些方法需要数据集中有比较多的序列,这样将会在单个位点上有足够的改变。更进一步说,这些方法得到的显著性值的可靠性受两个因素影响,包括重建的祖先序列和,密码子组成偏好。前者在正选择位点或变异位点上是非常不可靠的[24],而后者在单个位点的情况下是非常严重的。
在似然模型中,不太可能对每个位点都给一个omega值。标准的方法是用一个统计分布来表述不同位点的omega的变异。例如,我们可以把某个蛋白质分子上的位点分成几个假定的类{class},每个类有不同的omega比值[36,37]。这样,正选择的检测就可以用两步来实现。首先,检测是否有omega大于1的位点,这个在做的时候可以用似然率{likelihood-ratio}检测来比较两个模型,一个模型不允许{allow}这样的位点,另一个更通用的模型允许;然后第二步,当确认这样的位点存在时用Bayes检测坚定正选择位点。那些属于omega大于1的位点类并且有高的后验概率{posterior probabilities}(框一)的位点被认为是潜在的正选择的靶位点。这一理论在框三中有解释[20,36,37]。
Nielsen 和 Yang[36]开发了一个给予两个简单模型的似然率检测方法。一个是null模型,M1(中性)模型假定了一个omega=0保守位点的类和另一个omega=1的中性位点的类。而且备选模型M2,增加了第三个类,其位点的v值是从数据中估计的。模型的代码在PAML包的codeml程序中。如果M2对数据的匹配{fit}显著好于M1模型,并且估计的M2模型中第三个类的omega比例是大于1的,那么一些位点上就是承受正选择。Aanotto等人[38]用这种检测方法鉴定了HIV病毒基因组中nef基因上的几个强烈正选择的位点,虽然对这些位点的两两比对{pairwise}和移框方式{sildingwindow}搜寻的分析都没有找到这些位点。这类比较随后被发现在某些基因中检出能力并不够强{lack power},因为M1模型不能解释omega介于0和1之间的位点,因而M2模型中的第三类不得不用来解释这些位点[37]。有鉴于此,Yang等人[37]开发了几种别的模型。例如,beta分布(M7beta)是一个灵活的包含omega介于0和1之间情况的null模型。它可以被用来和一个包含带omega估计的额外位点类的模型(M8 beta&v)来比较。同样开发出来的还有一个通用的离散模型M3[37]。这些模型在作者分析的10个基因中的6个上能鉴定到正选择位点。图1展示了使用离散模型M3和三个类来鉴定在鲍鱼精子溶菌酶基因中承受正选择的位点的过程。
上面的这些方法中,我们都假定氨基酸的位点可以分成几个不同{heterogeneous}的类,但是我们并不先验地了解哪个位点属于哪个类。这种思路姑且称为“捞鱼期望”。<我理解捞鱼这个比喻意思是说,河里可能有鱼也可能没鱼,但是如果有鱼的可能性很大的话话,我们一网网捞,总会有一网能捞到鱼>它在得到可用实验室手段检验的假设时是有用的,因为他们能严格地鉴定出那些形成选择优势的氨基酸取代。而这样的取代可以用自然进化实验来验证。例如,承受分歧选择的氨基酸残基分析已在HIV-1病毒的nef基因[38]和env基因[40]中进行,而这些基因并不是病毒抗原表位的组成位点。另一种选择是,我们可以期望检测一个先验的假定,即蛋白质特定的结构和功能域是承受正选择的。在这样的情况下,可以构建似然模型来部署{assign}和估计来自不同结构和功能域的不同位点的omega参数[20]。
- 相关回复 上下关系8
🙂yale的那个课程很好,练听力或学生态都可以。 空格 字74 2010-06-22 22:35:53
🙂有这样的机制 2 空格 字1810 2010-06-22 22:34:37
🙂目前方法的局限和未来的改进 [全文完] 1 空格 字2461 2010-06-21 20:17:57
🙂检测氨基酸位点上所承受的达尔文选择
🙂乐章的插曲(episodes):检测线系特异的达尔文选择 4 空格 字1910 2010-06-19 20:29:57
🙂估计两条序列的dn和ds值 2 空格 字3425 2010-06-19 20:16:31
🙂细节看的有点糊涂 花大熊 字30 2010-06-25 05:42:44
🙂他的方法细节我也不太懂 空格 字191 2010-06-25 07:24:09