注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

NCBI中Blast序列比对结果解释  

2011-07-26 20:30:12|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
NCBI中Blast可以用来进行序列比对、检验引物特异性
Blast导航主页面主体包括三部分
BLAST Assembled Genomes选择你要对比的物种,点击物种之后即可进入对比页面
Basic BLAST包含5个常用的Blast,每一个都附有简单介绍
Specialized BLAST是一些特殊目的的Blast,如Primer-BLAST、IgBLAST
根据需要做出选择

本人本学期学习了最基本的核苷酸序列的比对
点击Basic BLAST部分的nucleotide链接到一个新的页面,打开后的页面特征:
大体上包括三个部分
Enter Query Sequence部分可以让我们输入序列,其中的Job Title部分可以为本次工作命一个名字
Choose Search Set部分可以选择要与目的序列比对的物种或序列种类。
其中的Entrez Query可以对比对结果进行适当的限制。
Program Selection部分可以选择本次对比的精确度,种内种间等等。
其次Blast按钮下面有一个“Algorithm parameters”算法参数,可设置参数。

点击Blast后,出现的页面大体上包括四个部分

一.所询问和比对序列的简单信息
1.询问序列的简单信息——名称、描述、分子类型、序列长度
2.所比对数据库的名称、描述和所用程序

二.Graphic Summary——blast结果图形显示
相似度颜色图(黑、蓝、绿、粉红、红,相似度由低到高)

三.Descriptions——blast结果描述区
1.到其他数据库的链接
2.描述以表格的形式呈现(以匹配分值从大到小排序)
(1)Accession下程序比对的序列名称,点击相应的可以进入更为详细的map viewer
(2)Descriptions下是对所比对序列的简单描述
接下来是5个结果数值:
(3)Max score匹配分值,点击可进入第四部分相应序列的blast的详细比对结果
(4)Total score总体分值
(5)Query coverage覆盖率
(6)E value——E(Expect)值,表示随机匹配的可能性。
E值越大,随机匹配的可能性也越大。
E值接近零或为零时,具本上就是完全匹配了。
(7)Max ident——匹配一致性,即匹配上的碱基数占总序列长的百分数。
(8)Links——到其他数据库的链接。

四.各序列blast的详细比对结果
数据库中不同序列比对的详细结果,每一个结果大体上包括3部分
1.所比对序列的名称、简单描述、长度。到其他数据库的链接。
2.比对结果的5个数值:
(1)score打分矩阵计算出来的值,由搜索算法决定的,值越大说明询问序列跟目标序列匹配程度越大
(2)Expect是输入序列被随机搜索出来的概率,该值越小越好。
(3)Identities是相似程度,即输入序列和搜索到序列的匹配率
(4)Gaps就是空白,即比对序列只有一条链上有碱基
(5)strand=plus/minus即询问序列和数据库里面序列的互补链匹配

http://www.biology-online.org/biology-forum/about16720.html
http://www.ncbi.nlm.nih.gov/staff/tao/URLAPI/new_view.html

Accesion - the ID of found sequence, click on it to get to the sequence info page (including all you need to know and sequence)
Description
Max score - this is calculated from the homology and length, basically, the higher, the more homologous sequences you have
Total score - don't know, what's the difference, but never had to, so I guess you can live without that also or find it in help :)
Query coverage - this tells you, how long piece of your sequence is covered by the one found. E.g. you can get coverage of 100%, but low homology, or you can have like 90% homology, but only on half of your sequence
E-value - this tells you the probability of getting this score and homology by chance (from random sequence), that is, the lower (the higher the number behind e-), the more reliable the result is. As I have mentioned above, it's not only about homology, but also about the length, because you can easily find any piece of 10 nucleotides in 3mld human genome with 100% homology, but if you have 350 nucleotides and get 70% homology, than it's still quite good
  评论这张
 
阅读(18298)| 评论(7)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016