五千年(敝帚自珍)

主题:翻译一个用贝叶斯方法进行系统发育分析的软件的使用说明 -- 空格

共:💬18 🌺48
全看分页树展 · 主题
家园 翻译一个用贝叶斯方法进行系统发育分析的软件的使用说明

构建系统发育树是分子进化研究中的相当重要的一个研究手段。构建树的方法,过去主要有距离法,简约法,最大似然法这三大类。进入新世纪以来,一种叫做贝叶斯分析的方法横空出世。很快得到了广泛的应用。用于系统发育的贝氏分析的软件,也冒出来很多。笔者在学习分子进化的过程中,被若干大牛推荐了一款据称比较可靠的贝氏分析的软件。名叫MrBayes。因为最近翻译翻上了瘾。所以决定把这个软件的说明也翻译出来。希望为想从事这个领域工作的盆友们提供一点便利。

按说,这里应该先介绍一下贝叶斯公式是个什么东西。但是,很遗憾地说,我不太懂这个公式的细节。照大里说,我们知道一个事件的概率是多少,那么就大概能知道,这个事情发生或者不发生的可能性有多大。但是贝大师剑走偏锋,他非要在这个事情已经按一定概率发生了之后,反过来修正我们之前假定的那个概率。个人私下以为,这个过程就是俗称“马后炮”或者“找后帐”的便是。能把这样一个过程发展成一套理论进而形成一个学派。还是顶着若干年正统统计学的口水来实现的。这位贝大师也真可算是人杰。

再说一遍,统计学我不懂,上面关于贝氏分析的理解是我自己的半瓶水,河里如果有懂行的大牛看到我放的厥词,千万务必要技痒难熬义愤填膺地站出来下笔千言指若悬河以正一下视听。免得我的流毒伤害到很多不名真相的群众。

至于我的翻译,好在主要涉及的是软件的使用,关于其理论背景并不很多。希望不会有很多理论上的错误。我尽力去做。具体格式和前面翻译的讲适应进化的统计检验的综述文章一样。

另外,仍然很抱歉地说,这篇文章同样可能不太适合入门级的读者。至少要了解分子生物学,进化生物学的基本知识才会比较好懂。上一次发那篇综述就有朋友提出这一点。不过我实在想不出有什么办法能把自己还要很费力才能看明白的东西写得能更浅显一点。我只能尽力翻译,如果有朋友有问题请提出,我尽量解释。解释不了的就请河里的大小水牛们指点。总以大家都能有所收获为佳。

这个话题或许会很小众,但是我希望对有兴趣的人会是非常有营养的一栋楼。

软件的网址在这里。下载或者查阅都很方便。另外,网上还有一些使用这个软件的教程貌似是繁体字版的。貌似也和原软件的使用手册颇有渊源。仅向这位疑似吴仲义老师学生的兄弟致敬,不管蓝绿。

另外,原手册中有些内容是需要字体和格式才能清楚理解的。在帖子里这些格式通通看不出来了。我只能先把译好的东西贴出来。然后自己整理一个doc格式的版本。回头全文译完后,如果哪位朋友需要,请给我短信留个信箱,我给您发一份全本无码的。

下面是手册的目录部分:

目录 ………………………………………………………………………………………………………………………… 2

1 介绍 ………………………………………………………………………………………………………………… 4

1.1 本手册的一些规范 ……………………………………………………………………………… 4

1.2 获取和安装 ……………………………………………………………………………………………… 4

1.3 开始 …………………………………………………………………………………………………………… 6

1.4 改变MrBayes程序窗口的大小 ……………………………………………………… 6

1.5 获取帮助 ……………………………………………………………………………………………………… 7

1.6 报告和修正程序bug ……………………………………………………………………………… 7

1.7 许可和担保 ……………………………………………………………………………………………… 8

2 教程:一个简单的分析 ……………………………………………………………………………… 8

2.1 快速启动版本 …………………………………………………………………………………………… 9

2.2 向MrBayes程序导入数据 …………………………………………………………………… 9

2.3 指定一个模型 …………………………………………………………………………………………… 11

2.4 设定先验 …………………………………………………………………………………………………… 13

2.5 检查模型 ……………………………………………………………………………………………………… 15

2.6 设置分析参数 …………………………………………………………………………………………… 16

2.7 运行分析 …………………………………………………………………………………………………… 19

2.8 何时终止分析 …………………………………………………………………………………………… 21

2.9 取代模型参数的摘要抽样 …………………………………………………………………… 22

2.10 树和枝长的摘要抽样 ………………………………………………………………………… 24

3.一个分区的数据集的分析 ………………………………………………………………………… 27

3.1.向MrBayes程序导入混合的数据 …………………………………………………… 27

3.2.给数据分区 …………………………………………………………………………………………… 28

3.3.给分区指定模型 …………………………………………………………………………………… 29

3.4.运行分析 ………………………………………………………………………………………………… 30

4.Bayes 3中使用的模型 …………………………………………………………………………… 31

4.1.核苷酸模型 …………………………………………………………………………………………… 31

4.1.1. 简单核苷酸模型 …………………………………………………………………………… 31

4.1.2. 对偶模型 …………………………………………………………………………………………… 33

4.1.3. 密码子模型 ……………………………………………………………………………………… 35

4.2.氨基酸模型 …………………………………………………………………………………………… 36

4.2.1. 固定速率模型 ………………………………………………………………………………… 37

4.2.2. 固定速率模型的评估 …………………………………………………………………… 37

4.2.3. 速率可变模型 ……………………………………………………………………………… 37

4.3.限制位点(二进制)模型 ………………………………………………………………… 39

4.4.标准离散(表型)模型 ……………………………………………………………………… 40

4.5.简约模型 …………………………………………………………………………………………………… 42

4.6.位点间速率差异模型 …………………………………………………………………………… 43

4.6.1. gamma分布的速率模型 ……………………………………………………………… 43

4.6.2. 自动互关联的{autocorrelated}gamma模型 ……………… 43

4.6.3. 不变位点的比例 …………………………………………………………………………… 44

4.6.4. 分区速率模型(位点特异的) ……………………………………………… 45

4.6.5. 推断位点速率 ……………………………………………………………………………… 45

4.7.树间速率差异:Covarion 模型 ………………………………………………… 46

4.8.拓扑和枝长模型 ………………………………………………………………………………… 47

4.8.1. 非约束和约束的拓扑 ………………………………………………………………… 47

4.8.2. 非时钟树(标准树) ……………………………………………………………… 48

4.8.3. 严格时钟树 ………………………………………………………………………………… 48

4.8.4. 宽松时钟树 ………………………………………………………………………………… 49

4.9.分区的模型 ………………………………………………………………………………………… 49

4.10.祖先状态重建 ………………………………………………………………………………… 50

5.常见问题 ………………………………………………………………………………………………… 51

6.程序第二版和第三版的区别 …………………………………………………………… 57

7.高级话题 ………………………………………………………………………………………………… 59

7.1.编译MrBayes …………………………………………………………………………………… 59

7.1.1. 用GNU的make来编译 ……………………………………………………………… 59

7.1.2. 用Code Warrior 或 Visual Studio编译 ……………… 61

7.2.编译和运行并行版的MrBayes …………………………………………………… 61

7.2.1.苹果机上的并行版 ……………………………………………………………………… 61

7.2.2. linux集群上的MPI版 ……………………………………………………………… 62

7.3.源代码 …………………………………………………………………………………………………… 62

8.致谢 ……………………………………………………………………………………………………………… 63

9.参考文献 …………………………………………………………………………………………………… 63

附录:MrBayes中用到的进化模型和建议{proposals}

通宝推:王树,xtqntd,兰之子,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河