注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

【转载】系统发育软件  

2011-11-09 12:50:25|  分类: 进化与系统学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |


  http://blog.sina.com.cn/s/blog_470b355201000ab1.html

系统发育软件

PHYLIP

PHYLIP是一个包含了大约30个程序的软件包,这些程序基本上囊括了系统发育的所有方面。PHYLIP是免费软件,并且可以在很多平台上运行(Mac, DOS, Unix, VAX/VMS, 及其它)。根据其作者Joe Felsenstein(来自于the University of Washington)所介绍的,PHYLIP目前已经是最广泛使用的系统发育程序。

PHYLIP是一个命令行程序,没有PAUP或者MACCLADE程序那样的鼠标点击的界面。软件的文档写得非常好,很容易理解,命令行界面也很简明。如 果想使用某一个程序,只要键入程序名称就可以了,程序界面可以从“infile”文件中自动读取数据。然后,使用者可以从选项菜单中选择选项,或者直接接 受默认值,然后程序会将结果输出到一个叫做“outfile”(也可以是“treefile”)的文件中去。如果另外一个程序还要读取这个输出文件,就必 须将“outfile”文件改名(改为“infile”)。图9.10给出了建立一个自引导的相邻连接的进化树的步骤的几个要点。接下来的部分我们将讨论 一些用PHYLIP程序推导进化树的细节问题。

分析蛋白质数据的程序

PROTDIST程序计算蛋白质序列比对的距离矩阵。这个程序允许使用者从三个氨基酸取代的进化模型中选择其中之一。最简单的也是最快的(也是最不理想 的)模型假定每一个氨基酸编程其它19中氨基酸的机会都是均等的。第二种是类别模型,在这个模型中,氨基酸分布在不同的分组中,按照转换的不同类别(转化 成本组的氨基酸或者其它分组的氨基酸)进行评估。推荐使用第三种(默认的)方法,这个方法使用一张通过观察氨基酸转换得到的经验表,即DayHoff PAM 001方阵(DayHoff, 1979)。在PHYLIP文档中和最新出版物(Felsenstein, 1996)中可以找到详细资料。

PROTPARS程序计算蛋白质序列的似然值。这个方法使用的进化模型同PROTDIST程序中使用的进化模型不同,前者在评估观察到的氨基酸序列的转化 的可能性时,考虑到潜在的核苷酸序列的转换。特别地,它作出如下(富有生物学意义的)假定:同义转化 [比方说:GCA (alanine)à GCC (alanine)] 比非同义转化的发生频率要高。这样,举个例子来说,如果两个氨基酸之间的转化需要在潜在的核苷酸水平上进行三次非同义转换,那么这个转换的可能行比起那些 在潜在的核苷酸水平上只要进行两次非同义转换和一次同义转换的氨基酸转化的可能性要小。PROTPARS不提供氨基酸转化的经验值选项(象PAM方阵那样 的)。

分析核酸数据的程序

DANDIST计算核苷酸序列的距离矩阵,然后运行NEIGHBOR或者PHYLIP软件包中的其它距离矩阵程序计算输出结果,产生进化树。 DANDIST允许用户从三种核苷酸取代模型中选择其中之一。比较老的(1969)Jukes and Cantor模型同PROTDIST程序中的简单模型很相似,前者假定所有的核苷酸取代频率都一相等。比较近的(1980)Kimura 双�参数模型与之也很相似,但是它允许用户把颠换的权重设置得比转换的权重要高。PHYLIP也包含DNAML,这是一个针对核苷酸数据的 最大似然程序。因为这个程序执行起来相当慢,所以下面将描述一个推荐使用的程序��Gary Olsen’s fastDNAml 程序(Olsen et al., 1994),这个程序是DNAml的“姐妹”程序。

PAUP

开发PAUP(Swofford, 1997)的目的是为系统发育分析提供一个简单的,带有菜单界面的,与平台无关的,拥有多种功能(包括进化树图)的程序。在苹果机(Macintosh)上使用过PAUP程序(版本3)的人对这个程序的菜单界面都会很熟悉,虽然这个版本已经不再发行了。PAUP 3.0只建立于MP相关的进化树及其分析功能;而PAUP 4.0已经可以针对核苷酸数据进行与距离方法和ML方法相关的分析功能,以及其它一些特色。

获取和编译程序

在商业版本发行之前,现行的出版物中,有成打的分析使用了PAUP 4.0测试版本(由原作者通过 blue@onyx.si.edu 提供)。菜单界面的测试版本已经在Macintosh 68K 、PRC 计算机和微软的视窗操作系统上编译通过。命令行版本已经在Sun Sparc、Supersparc、DEC Alpha(OSF1和OPENVMS)、SGI(32位和64位)以及linux上编译通过。

初学的用户应该将其中一个菜单版本浏览一遍。在这些版本中也可以使用命令行,这样会使得命令教程会变得容易一些。通常而言,命令都有缩写。比如,要执行启 发式进化树搜索的命令可以键入“hs[earch]”(大小写不敏感;括弧内的字符为选项)。而且,因为文件在各个平台之间都是可移植的,菜单版本可以用 来测试数据文件。如果希望在一个很快的Unix机器上跑一个分析程序,这个协议就显得非常重要。如果文件格式出错,菜单版本不仅仅报告文件格式的错误,而 且还会打开文件,将错误的地方高亮度显示。

数据格式

PAUP使用一种称为NEXUS的数据格式,这种格式还可以被MACCLADE程序使用,当然PAUP也可以输入PHYLIP, GCG-MSF, NBRF-PIR, HENNIG86数据格式以及文本比对(形如“{ name } <tab or space> { same-length sequences } <ret>”的列表,以“;<ret> end”结束)。Sequencher(基因密码有限公司)和Sequin程序可以输出NEXUS格式。其它格式的比对序列(CLUSTAL, FASTA, GDE等等)可以通过ReadSeq程序将其转化为NEXUS格式。如果使用ReadSeq程序,必须为每个单独的序列(分类单元)设计一个不超过八个字 符的名字,因为程序会自动截取过长的名字。PAUP中的名字可以无限长,但是每一个名字必须唯一。比对块(比方说,就像MSF文件)可以由空格分开,作为 更好的跟踪序列的位置。比对可以是连续的,也可以是较差存取的。PAUP文件中可以在方括号中写明注解和注释(比方说,比对中基本位置的标记)。PAUP 可以识别IUPAC核苷酸的模糊密码,但是这些密码在进行距离和ML分析时被看作是丢失的数据。

PAUP文件中的数据块可以包含附加的最优化信息,比如特征符和序列标签,丢失数据的定义以及特征符集和特征符权重集的定义;其语法同PAUP 3.0相同,并且可以通过帮助文档进行交互式查询。一个PAUP文件还可以包含假定和进化树块。这些块的格式同MACCLADE程序所使用的格式基本相同,只有若干差异(Maddison and Maddison, 1992);举个例子,MACCLADE不能识别空位模式,而空位模式在MP分析中将会把空位看作是附加的特征符状态(FORMAT<space>GAP= { character } <space> GAPMODE=newstate<space> { other format options };)。同样地,PAUP会忽略一些MACCLADE数据选项。

在某些情况下,很南对数据进行手工格式化,这时就可以用菜单界面或者交互式的MACCLADE程序输出正确的格式文件。举个例子,可以通过PAUP菜单界 面创建“假定集”。假定中可以包含一个外围集团的说明规范、特定分类群的排除以及特征符,如果是MP分析,还可以包含特征符权重和特征符类型的说明规范。 假定还可以存储为一个合适的格式文件;打开一个数据文件的时候,就可以加载这个文件,或者,可以把注释粘贴到一个早先创建的文件中,以避免在并发的通话中 需要将其加载。

PAUP也可以读取PHYLIP进化树的描述(从PHYLIP或者CLUSTAL输出),其中所提供的数据将被粘贴到一个NEXUS文件中的一个PAUP 格式(begin trees; <ret>utree= { tree name } <space> { tree description };<ret>end;)的进化树块中。但是,PAUP数据文件必须被激活,并且在PHYLIP树中必须包含确切的分类群。PAUP会输入拓 扑结构,以及优化的PHYLIP&#0;或者CLUSTAL&#0;衍生的树枝长度(命令为:gett[ trees ] /file- { treefile } st [ oredbrlens ])。

建立进化树

目前PAUP中的进化树建立功能包括MP方法,如果是针对核苷酸序列,还有距离方法以及ML方法,使用的是fastDNAml算法(Olsen et al., 1994)。而且,PAUP执行Lake’s不变式方法(Swofford et al., 1996a; Li, 1997)。每一种建树程序都允许使用多种的选项。MP选项包括任意特征符权重方案的说明规范。距离选项包括对NJ, ME, FM(见PAUP发行附注 re: PHYLIP)和UPGMA程序的选择。全范围的选项和他们的当前树枝可以通过菜单或者命令行进行查询(节约方法键入:pse [ ttings ] ?;距离方法键入:dse [ ttings ] ?;似然方法键入:lse [ ttings ] ?;)。距离方法和ML方法都有关于取代模型的详细的说明规范(取代数值,gamma, 以及不变位点的参数,假定相等,或者指定数值,或者经验的碱基频率)。任何进化树的这些参数都可以得到评估,只要设置参数数值为“est [ imate ]”, 并且用内存中一个期望使用的进化树执行“des [ cribe tree ]”命令(图9.7)。

根据同PAUP 4.0测试版本一起发行的附注所说的,“PAUP*所找到的进化树的似然值通常都会同PHYLIP的一样高甚至更高[ 也就是说,更加好 ]”(这不仅是因为PAUP对进化树进行重新排布时更加广泛,而且也是因为因为它对树枝长度的迭代的收敛标准更加严格)。

不管使用哪一种建树方法,PAUP都提供了多种的进化树搜索选项。这些选项包括产生初始进化树(启动进化树)的算法规范:NJ, 逐步相加,或者输入进化树。逐步相加的算法也提供大量的选项,包括分类群“原态”的加和(分类群按照文件顺序相加):最接近的,最遥远的,或者对任意数目 的复制品都是随机的。所有逐步相加算法的选项都考虑到了部分进化树的任意的最大数目,这些部分进化树是要保留下来并且在分类单元相加时进行扩建的。增大这 个数目(比方说,增大到100)也就意味着增大了起始拓扑结构的多样性,即使他们并不是随机的。

一个随机的相加策略是默认的搜索策略的有用的补充(最近的相加,TBR交换,保存所有最好的进化树)。在随机搜索中,有大量的复制品可以同较快的NNI交 换算法相结合。对于MP分析,可能存在这大量的长度相等的进化树,因此搜索时应该指定从每一个复制品中只保存一部分进化树,这些进化树同较慢的搜索的分值 相当或者更好。而且,次优化的进化树的数目(这些进化树将会被交换,以寻找更好的进化树)应该受到限制,可以通过设定MAXTREES将其降至一个较小的 数目(比方说,10)。通过这个策略,我们在浏览“进化树空间”区域时(这些区域很可能在较慢的搜索中被丢失),有时候会找到一些较好的进化树或者找到额 外的唯一的最优化的进化树。可以指定随机相加的种子,但是默认值总是一样的。因此,除非更换种子,重复随机相加的搜索只能得到同样的结果。

评估进化树

对于距离方法、MP方法和ML方法,PAUP执行无参数的自引导方法和对折方法,在执行过程中用到了这些建树方法的所有可用的选项。除非另外指定,所有的 自引导方法都才能够同样的种子开始(也就是说,重复同样的自引导分析,其结果相同)。如果自引导数值大于50%,则数值将会被绘制在进化树上;如果自引导 数值处于50%和任何指定的下界之间,则这些数值将从表格输出中决定。

对MP方法进行自引导分析或者对折分析时,MAXTREES应该设为10和不超过100之间的一个数。这时因为,MP进化树中分解性较差的那部分在用重新 取样得到的数据进行操作时,其分解性通常会更差;因此,一个复制品所找到的相同长度的进化树的数目很可能是一个天文数字。因为那些并不能够被全套数据集很 好地支持的进化树树枝的自引导数值或者对折数值不会很高,所以,对MAXTREES加以限制(即便是有一些)不会对结果带来多少负荷,尤其是当复制品的数 目增大到比方说1000的时候。

另外,PAUP执行Kishino&#0;Hasegawa实验以比较MP或者ML进化树(见发行附注 re: PHYLIP);计算多个进化树的四种类型的一致性(通常是对多个长度相等的MP进化树进行操作);计算MP进化树的逐步差异;评估指定分区之间的位点的信号冲突(比方说,在总和分析中,核内序列数据和细胞器序列数据)。

在PAUP中有不同的方法来确定一个约束进化树,但是最简单的方法是使用“loa [ d constraints ]”命令,从任何进化树文件或者任何数据文件中的进化树块中把一个或者多个进化树的定义输入到约束进化树缓冲中去。选择约束进化树要限定“hs [earch ]”命令。如果使用菜单,这个过程会很简单;也可以通过“help loa [ dconstr ]”和“help hs [earch ]”命令查询命令行的语法。

其它特色

许多(但不是所有的)PAUP命令选项都是触发开关,因此在一次通话中一个已经设定的选项保持激活状态。在执行一个新命令或者程序之前,特别是在执行一个 包含很多不同程序和数据集的复杂的会话之前,查询当前的设置是非常有用的;查询可以使用菜单,也可以在合适的地方直接键入命令“{ command-name }<space>?”。

PAUP拥有一额外的附加的特色,在这里我们之涉及到其中的一部分:(1)、为画图、打印或者将PICT文件进化树(包括PHYLIP或者CLUSTAL 进化树; 见图9.1)输出为若干种格式(但是,遗憾的是,不包括TreeDraw、PHYLODENDRON和TREEVIEW的辐射图)的基本的图形特色; (2)、一个能够编辑数据文件和日志文件的文字编辑器,这个编辑器可以分成四个面板,以浏览一个很长的比对或者日志的不同部分;(3)、将输出存入一个新 的日志文件,或者将输出附加到一个已经存在的文件中去;(4)、使用外围集团、指定的祖先、指定的祖先状态或者中点方法确定进化树的树根;(5)、计算 MP和ML方法中特征符状态的重新构建(如果这个程序使用ML,精确度可能会好一些,但是非常慢,而且对于超过100个不同位点和50个分类群的数据集, 几乎是不可实现的;输出结果可以被用来对一个进化树的变化进行手工标记);(6)、序列之间双重碱基差异的总和(现在叫做“二核苷酸频率”,当然以后的版 本可能会用其它名字)。

其它程序

除了PAUP和PHYLIP以外,还有其它一些系统发育程序,这些程序有一些独到之处,但是程序在处理过程和可移植性方面通常都有很多限制。这些程序包括FastDNAml, MACCLADE, MEGA plus METREE, MOLPHY和PAML。

FastDNAml

FastDNAml(Olsen et al., 1994)是一个独立的最大似然建树程序。虽然它还没有成为当前版本的PHYLIP软件包中的一员,但是它的输入输出约定同PHYLIP在很大程度上都是相同的,而且FastDNAml和PHYLIP’s DNAML的结果非常相似,甚至完全一样。FastDNAml可以在并行处理机上运行,而且它还自带了大量有用的脚本(尤其是关于自引导以及打乱序列输入顺序的脚本)。要想充分利用这个程序,就必须有一定的Unix知识。REP Web站点公布了Unix和VAX/VMS平台的程序源码,而通过FTP可以获得Power Macintosh版本的程序源码(见本章结尾的列表)。

MACCLADE

MACCLADE(Maddison and Maddison, 1992)是一个交互式的Macintosh程序,能够对进化树和数据进行操作,能够研究特征符的系统发育行为。程序使用的是NEXUS格式,它也能够读 取 PAUP格式的数据和进化树文件。PAUP文件中的一些信息会被MACCLADE忽略(比如,gapmode,空位模式),但是PAUP“假定”块中的信 息将会被 输入,其中包括特征符权重和特征符集以及分类群集。PAUP和MACCLADE文件仍然存在着一些细微的差别;因此,用MACCLADE编辑PAUP文件 或者用PAUP编辑MACCLADE文件时,需要将文件保存为一个新文件,从而保留原文件,使之不被改动。MACCLADE还可以读取PHYLIP文件、 NBRF-PIR文件以及文本文件(见上)。可以使用任何方法产生进化树,但是MACCLADE的功能是严格地基于节约方法的。举个例子,程序允许使用者 追踪任意进化树上的每一个单独特征符的进化轨迹。不管怎么说,MP和ML重新构建的功能是不同的,而且ML功能据称更加实际一些(Swofford et al., 1996a)。进化树的拓扑结构可以通过拖动树枝进行操作,而点击树枝则会在进化树的对称性上产生审美的修饰。

MACCLADE包括如下一些同序列分析相关的附加的特色:

  1. 能够方便地编辑模糊区域的数据编辑器,因为序列块可能会被转变为丢失的数据符号。
  2. RNA或者DNA翻译成氨基酸数据。
  3. 识别IUPAC核苷酸的模糊密码。
  4. 以特征符数目和进化树上变化的数目为维度的图表,通过这张图,可以直观地观察位点内部的速率差异性。
  5. 一个MP进化树的各种碱基之间相互转变的总量的图表(“状态转变和统计”图表:其中有些数据可能是在文献中被错误地报告为取代“速率”,但是对于树枝长度或者位点内部的速率差异完全没有修正)。
  6. 根据四种不同的规则将状态转变和统计数值转化为一个权重矩阵。
  7. 计算密码子位点。
  8. 为制图功能以及从数据集中切除位点选择密码子位置。
  9. 一个基本的比对编辑器,允许拖拉被选的序列块。
  10. 能够输出同PRETTY格式相似的数据,其中的序列块由空格分开,并且与第一个序列相匹配的碱基标记为“.”。
  11. 同PAUP相似的一个进化树图形编辑器,同样允许在每一个数值上对特征符变化作出标记。
  12. 为PAUP分析定义约束进化树的简单方法(仅仅是简单地瓦解那些非约束的节点,然后将进化树存储为一个文件)。

MEGA plus METREE

MEGA(Kumar et al., 1994)是一个关于序列分析以及比较统计的DOS程序的软件包,其中包括有距离建树方法和MP建树方法。对于MP建树方法,将执行分支定理和启发式算 法;对于距离建树方法,MEGA提供了PAUP中的取代模型的一个子集,也提供了NJ建树算法。在其捆绑的METREE程序(Rzhetsky and Nei, 1994)中提供了一个ME搜索。现在还无法比较MEGA和PAUP或者PHYLIP中的搜索算法的效率和可靠性。针对核苷酸数据建立进化树,MEGA的 效果不如PAUP(Lewis and Lewis, 1995)或者PHYLIP。举几个例子:其格式不允许在数据文件中存储假定,因此必须在每一次会话中手工指定这些假定;取代模型的范围和空位处理方法以 及丢失的数据都是有限的,并且程序不能评估参数数值;似然方法不允许加权;不能IUPAC核苷酸的模糊密码;使用MP方法时不允许进行自引导分析;进化树 图形很简单,并且不能保存进化树文件。虽然MEGA可以通过密码子数据和氨基酸数据建立距离进化树,但是使用的取代模型太简单,对于绝大多数数据集而言, 不能产生可靠的进化树。MEGA同其它程序一样,也没有包括一些有用的特点(Lewis and Lewis, 1995):空位和空位大小频率,密码子的用法和氨基酸频率。

MOLPHY

MOLPHY(Adachi and Hasegawa, 1996)是一个共享的软件包(见本章结尾的列表),可以进行ML分析以及核苷酸序列或者氨基酸序列的统计。MOLPHY在Sun OS和HP9000/700系统上经过测试。在实际使用时需要对Unix文件操作有一定的了解。MOLPHY的用途包括NEXUS, MEGA和PHYLIP文件格式之间的数据文件的格式转换,还包括从EMBL或者GeneBank的核苷酸序列文件中提取编码区域。其中的ML程序同 PHYLIP中的ML程序很相似,但是前者的氨基酸取代模型的范围很广,而且有很多选项能够进行快速的启发式的搜索,其中包括一个选项能够使用“本地自引 导”分析(也就是说,进行一个子树的自引导分析,条件是假定这个进化树的剩余部分是正确的)以搜索更好的ML进化树。输出结果包括树枝长度评估以及标准偏 差。分析分离的密码子位置是可能的。MOPHY使用PAUP中提供的核苷酸取代模型的一个子集,尽管它允许使用者自行指定参数数值。现在使用的 MOLPHY缺少一个自引导选项,也不能包容位点内部的速率差异性。

PAML

PAML(Yang et al., 1996)是一个共享软件包(见本章结尾的列表),能够进行ML模型的建立和进化树的建立,能够进行Bayesian进化树的建立,能够进行模拟实验,能 够进行基于似然方法的进化树的分析,能够进行进化树评估以及数据和进化树的统计。这个软件包已经在Macintosh 68K和PowerPC计算机上编译通过,还有一个非编译的Unix版本(GNU gcc或者Sun ANSI C)。对于密码子数据和氨基酸数据,这个程序提供了最详细的和最灵活的参数指定和评估方案。对于核苷酸数据(BASEML和BASEMLG),取代模型的 范围同PAUP的一样广泛,可能包括了所有值得考虑的模型。PAML执行不额外的模型:相邻位点的速率相关性(自动离散&#0;gamma模型) 和一个多基因模型,这个模型允许对每一个基因指定取代模型。后者对于分析来自于不同基因(在不同约束下进化)的混合数据非常有用。下列步骤可能很有用:受 限用PAUP进行ML进化树的建立,然后转向PAML,评估是否加入这些参数以改善似然值。PAML还包括一个在非静态条件下(序列之间的碱基频率变化很 大)建立进化树的似然方法,但是对于超过四个序列的系统,这个方法被认为是不实用的。CODONML程序对于评估密码子频率、每一个密码子位置上的碱基频 率以及每一个(非)同义位点上的(非)同义取代的数目非常有用。一个受到限制的PAML特色是能够从数据集中把包含一个空位的所有位点或者丢失的数据分值 (不允许存在IUPAC模糊密码)排除出去。当分类群数目增加时,一个给定位点至少要达到的似然分值也随之增加;因此这个限制要冒一定的风险,很可能会把 很有用的数据也切除掉。同时,PAML中的进化树搜索算法也受到MOLPHY中采用的不严格的星型分解方法的限制。因此,必须采用多重搜索。

一些简单的实际的考虑

  1. 不管听起来多么荒谬,到目前为止,在进行系统发生的推断分析中,最重要的因素不是进行系统发生推断所采用的方法,而是输入数据的质量。数据选择的重要行以及尤其是比对过程的重要性都不能过高估计。即使是最复杂的系统发生推断方法都不能校正输入数据的错误。
  2. 从尽可能多的角度观察数据。使用三种主要方法(距离方法,最大节约方法,最大似然方法)中的每一个,然后比较它们所建立的进化树的一致性。同时,要清醒地 意识到我们不能只是因为所有这三个方法产生了相同的进化树,就认为已经达到了相对于真实系统发育的一个较好的评估。不幸的是,由不同方法得到的结果的一致 性并不能必然地意味着结果就是统计显著的(或者代表这真实的系统发生史),因为达到一致性的因素很多。
  3. 选择外围的分类群同内在的分类群的选择对于分析的影响是相当的。尤其是当外围的分类群同一个或者几个内在的分类群拥有一个相同的不同寻常的属性(比方说,组成偏好或者始终频率)时,问题就会复杂化(Leipe et al., 1993)。因此合理的做法是用若干个外围的分类群计算每一个分析,检查内在分类群的拓扑结构的一致性。
  4. 要清醒地意识到程序可以给出不同的答案(进化树),仅仅是因为序列出现在输入文件的顺序不同。PHYLIP, PAUP以及其它系统发育软件提供了一个“混乱”选项,可以按照不同的(混乱的)输入顺序重新运算。如果不管是什么原因,必须在一次运行中计算进化树,怀 疑有问题的的序列应该放置在输入文件的结尾,以降低进化树重新排布方法受到一个较差的初始拓扑结构(这个拓扑结构来源于任意的有问题的序列)的负面影响的 可能性。

第九章所涉及到的因特网资源:

系统发育学的资源(PHYLOGENETIC RESOURCES):

在加州大学伯克力分校的古生物学博物馆有一个因特网站点,组织得非常好,如果你对这个领域感兴趣,最好能够把这个地址保存在收藏夹里。这个站点所搜集的系 统发育学的程序并不象其它站点那样多,但是它的页面里包含了许多与系统发育学有关的链接,其中包括出版物、介绍、新闻组、协会、会议通知以及大量的分子生 物学和分类生物学数据库。

http://www.ucmp.berkeley.edu/subway/phylogen.html

系统发育学的程序(PHYLOGENY PROGRAMS):

通过这个网站浏览现有的系统发育学的软件是个非常好的选择。在这个站点中有大约一百个系统发育学的程序简单的描述,按照程序方法(长程方法,似然方法,节 约方法等)和运行的计算机平台(Unix,Mac,Pc等)组织起来。另外,它还提供了这些软件的下载网址或者商业软件的出版网址。

http://evolution.genetics.washington.edu/phylip/software.html

系统发育学计算机分析程序(PHYLOGENETIC ANALYSIS COMPUTER PROGRAMS):

这是个关于生命树的网页。它所提供的系统发育学程序没有上一个网站那么多,但是程序的说明更加详尽,并且除了画树程序以外,它还提供了序列编辑器和其他一些分子生物学的软件工具。

http://phylogeny.arizona.edu/tree/programs/programs.html

节约算法分析软件(PARSIMONY ANALYSIS SOFTWARE):

这个站点是由IWHS(Iternational Willi Hennig Society)维护的,专门研究节约算法,其中许多程序同PAUP或者Hennig86互相影响。

http://www.vims.edu/~mes/hennig/software.html

生物目录分子进化(BIOCATALOG MOLECULAR EVOLUTION):

欧洲生物信息学研究所提供了大量系统发育学软件的链接。这个站点提供的STATALIGN程序似乎是独一无二的,其他站点都没有。

http://www.ebi.ac.uk:/biocat/phylogeny.html

杆页(ROD PAGE’S HOME PAGE):

这个主页提供了少量的系统发育学的分析软件,这些程序是基于苹果机或者视窗操作系统的,包括下面提到的TreeView程序。

http://taxonomy.zoology.gla.ac.uk/rod/rod.html

读取序列(READSEQ):

这里有一个文件格式转化程序,可以把一种格式的序列文件转化成另一种格式的序列文件。这个站点的页面上有一个拷贝—粘贴(copy—and—paste)窗口和一个下拉菜单,用户可以选择14种常用的序列文件格式中的一种作为输出格式。

http://dot.imgen.bcm.tmc.edu:933/seq-util/Optiions/readseq.html

序列输入输出(SEQIO):

这个站点有一个软件包,其中包括了READSEQ程序的可执行版本,还有其它许多的关于数据库搜索的软件和分子生物学家们可能会用到的计算机工具。这个软 件包可比READSEQ程序复杂得多,必须下载后安装才能使用。如果只是想进行简单地序列文件格式转化,READSEQ要快得多。

http://wwwcsif.cs.ucdavis.edu/~knight/seqio.html

PHYLIP

这是一个分析系统发育的免费软件,有关软件的简短介绍可以在线阅览,但是软件和完整手册需要下载。

http://evolution.genetics.washington.edu/phylip.html

画树程序(TREEVIEW):

这个站点的画树软件是基于苹果机和视窗操作系统的,它读取标准的NEXUS和PHYLIP格式的系统发育树文件。这个软件允许用户重新定义树根和其它一些 简单的节点,系统发育树可以打印或者保存在一个文件中(在苹果机中是PICT,在视窗操作系统中是图元文件),以备日后处理。这个程序对于出版物中的系统 发育树的描绘很有帮助。

http://taxonomy.zoology.gla.ac.uk/rod/treeview.html

在RDP树上进行系统发育定位(SUGGESTING A PHYLOGENETIC PLACEMENT ON THE RDP TREE):

这项服务允许用户自行输入一段小的RNA序列,把这段序列用快速DNAml画树程序定位到已有的RDP(Ribosomal Database Project)树上。这项服务快得令人惊奇,它可以在不到一分钟的时间里返回一个大约包含20个物种的系统发育树,但是它还不能进行彻底的分析。

http://rdp.life.uiuc.edu/RDP/commands/sgtree.html

  评论这张
 
阅读(1426)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016