五千年(敝帚自珍)

主题:翻译一个用贝叶斯方法进行系统发育分析的软件的使用说明 -- 空格

共:💬18 🌺48
全看分页树展 · 主题 跟帖
家园 介绍第一

MrBayes 3是一个将Bayes推断应用于系统发育{phylogeny}分析的程序。本程序使用命令行界面,可以在多种系统平台上运行,包括苹果和linux的集群{cluster}。注意程序使用的计算机应该足够快而且有相当数量的内存(内存的需要量依赖于数据矩阵的大小,程序可能最多需要到几百M的内存)程序是按照最快运算速度优化的而不是按照最小内存量来优化的。

本手册告诉您如何使用程序。在这一部分只是介绍一下本程序的概貌,之后我们会领您看一些简单的分析(本手册的第二部分)。之后在第三部分我们会进入一个复杂些的分析,向您展示程序的更多的性能{capabilities}。第四部分我们向您介绍一下程序所使用的模型。之后的第五部分会回答一些常见问题。第六部分讨论一些第二版和第三版的差异。最后的第七部分,我们会给出一些更细节的建议,主要是关于如何编译和运行并行版程序的问题。第七部分同样包含一些开发者最关心的问题,包括如何对程序代码作微调以及如何加入MrBayes项目并作出贡献。最后有一个附录部分,给出了一些图表,图示化地展示了程序中用到的模型和建议的机制{proposal mechanisms}的概貌。至于MrBayes程序更细节的命令和选项的信息,请从网站上下载命令参考或查看命令行的帮助(见第1.4节获取帮助)。

所有的命令行帮助的信息都可以在使用在线程序时获得。

本手册假定读者熟悉Bayes系统发育分析的基本概念。如果您是这个领域的新手,我们推荐您看看最近的几篇综述,包括 Holder 和 Lewis (2003), Lewis (2001) 和 Huelsenbeck 等人 (2001, 2002)的。同样有价值的是一些早期的介绍Bayes系统发育方法的一些文章(Li 1996; Mau, 1996; Rannala and Yang, 1996; Mau and Newton, 1997; Rannala and Yang, 1997; Larget and Simon, 1999; Mau, Newton and Larget, 1999; Newton, Mau and Larget, 1999)。基本的MCMC技术在Metropolis et al. (1953) 和Hastings (1970)中有提到。而MrBayes 程序中用到的 Metropolis-coupled MCMC 方法在Geyer (1991)的文章中有提到。

1.1 本手册的一些规范

读者在屏幕上和输入文件中看到的内容用斜体字体表示。需要用户输入的字体用加粗的斜体字体表示。<手册原文使用的是plain typewriter字体和加粗的plain typewriter字体来表示>

1.2 获取和安装

MrBayes程序可以在MrBayes网站上免费得到(http://mrbayes.net)。如果有人给来您一个MrBayes 3程序,我们强烈在建议您从这个网站上下载最新的版本。该网站上同样给出了关于MrBayes用户邮件组和如何参加开发项目的信息。

MrBayes是一个简单的使用命令行界面的程序,因而在不同的操作平台上会有相同的表现,无论苹果{Macintosh}系统,瘟到死{windows}系统,Unix系统。各平台有彼此独立的下载包。苹果的包有两个版本,名为MrBayes3.1的标准版本(program icon one copy of Reverend Bayes’s portrait)和名为MrBayes3.1p的用于苹果机集群上的并行计算版本(program icon four portraits of Reverend Bayes)。关于MrBayes苹果机并行版的更多信息请参考POOCH的安装信息,具体可参考本手册后面第七部分。而瘟到死版只包含串行程序,解压缩后可以直接运行。

如果您需要在unix或犁牛渴死{linux}上运行MrBayes程序,您需要从源代码编译。在这种情况下,您需要用下面的命令解压缩mrbayes3.1_src.tar.gz文件即可:

gunzip MrBayes_3.1_src.tar.gz

然后

tar –xf MrBayes_3.1_src.tar

注意gunzip命令解开压缩包。而 tar -xf 命令从解压后的.tar 文件中释放打包的内容(注意 .gz 后缀在解压缩后就被去掉了)。然后一步的工作是编译程序。解压后的包中包含一个名为Makefile的文件,可以生成串行版的编译程序。只要输入make就可以编译这些内容。典型的编译时的输入类似下面的样子:

ronquistg5:mrbayes>ls

mrbayes3.1_src.tar.gz

ronquistg5:mrbayes>gunzip MrBayes_3.1_src.tar.gz

ronquistg5:mrbayes>ls

mrbayes3.1_src.tar

ronquistg5:mrbayes>tar -xf MrBayes_3.1_src.tar

ronquistg5:mrbayes>make

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o mb.o mb.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o mcmc.o mcmc.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o bayes.o bayes.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o command.o command.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o mbmath.o mbmath.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o model.o model.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o plot.o plot.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o sump.o sump.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -c -o sumt.o sumt.c

gcc -DUNIX_VERSION -O3 -Wall -Wno-uninitialized -lm mb.o bayes.o command.o

mbmath.o mcmc.o model.o plot.o sump.o sumt.o -o mb

ronquistg5:mrbayes>

编译程序一般会在mcmc.c文件编译时停留若干分钟。这是正常现象。这是最大的一个源代码文件,优化它们需要比较长一点的时间。

我们缺省使用的C编译器是gcc。在绝大多数系统上都缺省安装了这个编译器。如果您的机器上没有这个编译器,或者您需要生成MPI版本,您需要修改编译信息中的内容。具体参见本手册第七部分。可执行的串行程序名为”mb”。若要运行它。只需在编译的子目录里键入

./mb

即可。其中“./”前缀是告知unix系统你要运行的是本地本子目录中的该程序的一个拷贝。如果你需要经常运行mb程序,你可能需要把这个程序加到你的系统路径{path}中去。请查阅您的unix手册或咨询您身边的unix系统专家来解决此问题。

所有三个MrBayes程序都附带样例数据文件。他们被设计来展示程序所能运行的各种分析。您可以以这些例子作为模板来设计您自己的分析。其中有两个文件primates.nex和cynmix.nex在后文第二和第三部分中被使用。

1.3 开始

双击MrBayes应用图标就可以开始程序,或者键入./mb后回车。您将能看到如下的信息。

MrBayes v3.1

(Bayesian Analysis of Phylogeny)

by

Fredrik Ronquist and John P. Huelsenbeck

School of Computational Science

Florida State University

[email protected]

Section of Ecology, Behavior and Evolution

Division of Biological Sciences

University of California, San Diego

[email protected]

Distributed under the GNU General Public License

Type "help" or "help <command>" for information

on the commands that are available.

MrBayes >

注意作者的次序是每次程序启动时随机变化的。所以如果发现这一次启动程序后的作者次序和上一次启动程序不一样时请保持情绪稳定,不必大惊小怪。注意底部的MrBayes >提示符。出现这个提示符说明程序已经作好工作准备。

1.4 改变MrBayes程序窗口的大小

有的MrBayes的命令会生成很多行的输出结果。您可能会需要把窗口尺寸扩大以方便地读您的结果。在苹果和Unix机器上,您只要拖动窗口的边缘就可以了。但是在瘟到死系统上(包括2000,XP,NT血色),您就不能这么简单地操作。您需要用右键单击MrBayes窗口顶部的蓝色标题栏,然后在出现的菜单中选择“属性”。在跳出来的新窗口中,确认“布局”{Layout}项被选定,然后将窗口尺寸和窗口缓冲大小按您的需要修改。

1.5 获取帮助

在mrbayes>提示符下键入help 可以看到一个MrBayes中可用的命令的列表。绝大多数命令允许你为不同的参数设定值(选项)。如果你键入 help <command> ,其中的尖括号表示某个特定的命令。那你就可以得到这个特定命令的帮助,包括了所有可选的参数的介绍。对于大多数命令,在介绍的结尾能看到所有参数目前的设定值。例如,试试执行help lset 或 help mcmc命令。则lset的设置会被显示如下:

Default model settings:

Parameter Options Current Setting

----------------------------------------------------------------------------------------------

Nucmodel 4by4/Doublet/Codon 4by4

Nst 1/2/6 1

Code Universal/Vertmt/Mycoplasma/

Yeast/Ciliates/Metmt Universal

Ploidy Haploid/Diploid Diploid

Rates Equal/Gamma/Propinv/Invgamma/Adgamma Equal

Ngammacat <number> 4

Nbetacat <number> 5

Omegavar Equal/Ny98/M3 Equal

Covarion No/Yes No

Coding All/Variable/Noabsencesites/

Nopresencesites All

Parsmodel No/Yes No

------------------------------------------------------------------------------------------------

注意MrBayes3中支持命令和选项的缩写,所以在很多情况下可以键入命令开头的少数几个字母来代替命令的全称。

在命令行界面下,有一个全部命令和选项的列表。这个列表可以在程序的网站上下载得到(http://www.mrbayes.net)。你同样可以得到一个ASCII码格式的版本方式为在命令行提示符后输入manual命令。更多的帮助有Jeff Bates 在mrbayes网站上做好的一系列html格式的超链接。最后,你可以通过mrbayes的用户邮件组与其他mrbayes程序的使用者保持联系(提交信息到www.mrbayes.net )。

1.6 报告和修正程序bug

如果您在使用中发现了bug。您可以在SourceForge上的报告错误功能来通知我们。我们会对您的行为深表感谢。提交错误报告的功能在网站上也有介绍(www.mrbayes.net)当您提交一个错误报告时,请确认您上传了一个包含数据集和产生错误的命令列表的数据文件。

如果问题出现在运行MCMC分析的过程中(在执行”mcmc”命令之后),请确认您的错误报告中包含了mcmc命令行中的固定种子{fixed seed}和交换种子{swapseed},最好还包括一个小的数据集。这对我们分析您报告的错误会非常有帮助。如果这个问题被确定是MrBayes源代码的问题。SourceForge的追踪器程序会给您发一封email通知您。然而,需要注意的是,确认修正了源码错误的新的可执行程序会在晚一点的时间内发布。

高级用户可能会倾向于自行确定源码中的错误。请到本手册第七部分查询如何参与源码维护,算法改进或功能扩展等工作。

1.7 许可和担保

MrBayes是一个自由软件。您可以遵循自由软件基金会的GNU通用公共授权{General Public License}来修改或重新发布它。无论第二版或以后的版本都是如此。

本程序希望是有用处的,但是并不保证这一点!甚至没有暗示此软件可以对某类问题具有特别的适用性!请参考GNU通用公共授权来获得更多的细节(http://www.gnu.org/copyleft/gpl.html)。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河