登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

BlastN/MegaBlast/Discontiguous MegaBlast 的区别  

2010-08-12 15:10:47|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

三者之间的共同之处就是 BlastN/Megablast/Discontiguous megablast 都是BlastN,就是核酸序列比对核酸序列的算法。

简单而言
BlastN : 应该是出现较早的算法。比对的速度慢,但允许更短序列的比对(如短到7个碱基的序列)。

MEGABLAST : 主要用来鉴定一段新的核酸序列,它并不注重比对各个碱基的不同和序列片断的同源性,而只注重被比对序列是否是数据库未收录的,是否为新的提交序列或基因。 速度快。同一物种间的。

Discontiguous MEGABLAST : 灵敏度(sensitivity)更高,用于更精确的比对。主要用于跨物种之间的同源比对。

详细解释
1,MEGABLAST 常被用于鉴定核酸序列

MEGABLAST is the tool of choice to identify a nucleotide sequence.

MegaBLAST也是一种BLASTN程序,不过它主要是用来在非常相似的序列之间(来自同一物种)比对同源性的。

鉴定某一段核酸序列是否存在于数据库,最好的方法是选择MEGABLAST。如果比对到的序列在数据库中注释完整的话,那该序列丰富的注释可以当作新序列的参考。当然,BlastN/MEGABLAST/Discontiguous MEGABLAST,都可以完成这种事情。但MEGABLAST就是特别设计用于非常相似序列之间的比对,可用于寻找查询序列的最佳匹配的序列。
2,Discontiguous MEGABLAST 更好地用于查找不同物种的相似的核酸序列,而不是与查询序列相同(identical)物种的。

Discontiguous MEGABLAST is better at finding nucleotide sequences similar, but not identical, to your nucleotide query.

Discontiguous MEGABLAST,用于跨物种核酸序列快速比对。它使用非重叠群字段匹配算法(noncontiguous word match)来进行核酸比对。Discontiguous MegaBLAST比blastx等翻译后比对要快得多,同时它在比较编码区时也具有相当高的敏感度。

但是需要指出的是,核酸与核酸之间的比对并不是发现同源蛋白编码区域的最佳方法,直接在蛋白水平用Blastp比对更好。这是因为密码子的简并性。(Lc.注:翻译得有些拗口,多多见谅!)

Discontiguous MEGABLAST详细介绍:www.ncbi.nlm.nih.gov/blast/discontiguous.html

原文:http://www.ncbi.nlm.nih.gov/blast/producttable.shtml#tab31


MegaBlast/Discontiguous MegaBlast/BlastN, Blastp/PSI-Blast/PHI-BLAST的区别与选择

从blastn页面上的简单帮助可以看到Highly similar sequences (megablast)多用于比较相似性比较高(相似性在95%以上)的序列,速度快;More dissimilar sequences (discontiguous megablast)用于相似性稍低于megablast的比对,但是灵敏度和精确度更高,多用于不同物种间的同源比对;而Somewhat similar sequences (blastn)用于比对相似性较差的序列,可以比对最短7个碱基的长度,所以比对精确度最高,比对结果最多,速度最慢。

所以,在选择的时候根据你提交的序列和搜索的目的进行选择,如果是想看这段序列在数据库当中是否有收录,可以用megablast,如果想用其他物 种的基因注释信息来注释一个未注释物种的序列,可以选择discontiguous megablast,如果想得到更多更全面的结果,可以选择blastn。

说完blastn,接着说blastp~blsatp中也有三个不同的算法可以选择,如下:

blastp (protein-protein BLAST)就是简单地进行蛋白与蛋白的比对,寻找蛋白质相
似序列;

PSI-BLAST (Position-Specific Iterated BLAST)叫做位点特异性迭代比对,它
在蛋白质数据库中循环搜索查询蛋白质,所有前一次被psi-blast发现的统计显著蛋白质序
列将整合成新记分矩 阵,通过多次迭代比对,直到不再发现统计显著的新蛋白质;

PHI-BLAST (Pattern Hit Initiated BLAST)可以在搜索的时候限定蛋白质的模式
(pattern),只给出包含此模式的比对结果。

Blastp/PSI-Blast/PHI-BLAST都是蛋白序列与蛋白序列之间的Blast比对

1. Blastp: 标准的蛋白序列与蛋白序列之间的比对 Standard protein BLAST is designed for protein searches. Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。跟其它的Blast程序一样,目的是要找到相似的区域。

2. PSI-BLAST : 敏感度更高的蛋白序列与蛋白序列之间的比对 PSI-BLAST is designed for more sensitive protein-protein similarity searches. Position-Specific Iterated (PSI)-BLAST,是一种更加高灵敏的Blastp程序,对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效。当你使用标准的Blastp 比对失败时,或比对的结果仅仅是一些假基因或推测的基因序列时(”hypothetical protein” or “similar to…”),你可以选择PSI-BLAST重新试试。

3. PHI-BLAST : 模式发现迭代BLAST PHI-BLAST can do a restricted protein pattern search. PHI-BLAST, 模式发现迭代BLAST, 用蛋白查询来搜索蛋白数据库的一个程序。仅仅找出那些查询序列中含有的特殊模式的对齐。

PHI的语法详细介绍看这里:http://www.ncbi.nlm.nih.gov/blast/html/PHIsyntax.html

 

  评论这张
 
阅读(1830)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018