登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

Blast使用方法攻略(三)  

2010-01-01 12:17:37|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

常见问题

1.运行formatdb时报下列错误:

[formatdb] ERROR: 1.seq.nhrOutput

Blast-def-line-set.E.<title>

Invalid value(s) [9] in VisibleString [seq1#ss ...]

这种情况通常是subject序列的标题行中含有非法字符,比如Tab。

 

2.运行blastall时报下列警告:

[blastall] WARNING: seq1: Could not find index files for database sub.seq

出现这种问题通常是没有做formatdb建库或者建的库不符合比对类型要求,需要重新建库。尤其注意tblastx的建库应该使用核酸库。

 

3.运行blastall时报下列警告和错误:

[blastall] WARNING:  [000.000]  seq1: SetUpBlastSearch failed.

[blastall] ERROR:  [000.000]  seq1: BLASTSetUpSearch: Unable to calculate Karlin-Altschul params, check query sequence

[blastall] ERROR:  [000.000]  seq1: BLASTSetUpSearch: Unable to calculate Karlin-Altschul params, check query sequence

 

这种情况多出在reads等短序列的比对中,某一个query序列的有效长度是0,则会导致这个错误。但是这个错误不会影响到其他query序列的正常比对,通常情况下可以忽略。

 

4.运行blastall时报下列警告并退出:

[blastall] WARNING:  [000.000]  seq1: Unable to open BLOSUM62

[blastall] WARNING:  [000.000]  seq1: BlastScoreBlkMatFill returned non-zero status

[blastall] WARNING:  [000.000]  seq1: SetUpBlastSearch failed.

这是因为做蛋白相关比对的时候目录下没有蛋白比对矩阵BLOSUM62。

实例

其他四种比对方式的使用和blastn大同小异,下面通过几个例子加以概括:

1.用BLOSUM45矩阵、“-F F”参数对两条相似的蛋白做blastp比对:

输入的query序列:query.seq

输入的database序列:db.seq

运行命令:blastall -i db.seq -d db.seq -o blastp.out -p blastp -F F -M BLOSUM45

输出结果存放在:blastp.out

2.用一条核酸序列和一条蛋白序列做交叉比对blastx和tblastn:

输入的核酸序列:cdna.seq

输入的蛋白序列:pep.seq

运行命令:

blastall -i cdna.seq -d pep.seq -o blastx.out -p blastx

blastall -i pep.seq -d cdna.seq -o tblastn.out -p tblastn

输出结果存放在:

blastx.out

tblastn.out

3.用2条核酸序列蛋白比对tblastx:

输入的query序列:query.seq

输入的database序列:db.seq

运行命令:blastall -i query.seq -d db.seq -o tblastx.out -p tblastx -e 0.5

输出结果存放在:tblastx.out

 

练习

1.用blast搜索人类基因组Chr10的重复序列(提示,为了减少比对时间,可以采取分割比对的方法)。

2.用blast查找蛋白序列ENSP00000328808在人类基因组Chr10上的位置。

3.用blast检查以下引物primer1和primer2是否可以用作在参考序列refseq上扩增。(提示,注意引物可能发生错配的条件和blast的比对参数)

>refseq

CTTAATTCGCCTCGTGAAAGAATATCATCTGCTGAACCCGGTCATTGTTG

ACTGCACCTCCAGCCAGGCAGTGGCGGATCAATATGCCGACTTCCTGCGC

GAAGGTTTCCACGTTGTCACGCCGACGGCACCTCCAGCCAGGCAGTCGAT

GGATTACTACCATCTGTTGCGTCATGCGGCTGAAAAATCGCGGCGTAAAT

TCCTCTATGACACCAACGTTGGGGCTGGATTACCGGTTATTGAGAACCTG

CAAAATCTGCTCAATGCTGGTGATGAATTGATGAAGTTCTCCGGCATTCT

TTCAGGTTCGCTTTCTTATATCTTCGGCAAGTTAGACGAAGGCATGAGTT

 

>primer1

ACTGCACCTCCAGCCAGGCAG

 

>primer2

GATATAAGAAAGCGAACCTG

 

参考文献

1.   Altschul, S.F., Gish, W., Miller, W., Myers, E.W., and Lipman, D.J. 1990. Basic local alignment search tool. J. Mol. Biol.215: 403–410.

2.   Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z.,Miller, W., and Lipman, D.J. 1997. Gapped BLAST and PSI-BLAST: A new generation of protein database search programs. Nucleic Acids Res. 25: 3389–3402.

 

From : BGI-生物信息学培训教材

  评论这张
 
阅读(3199)| 评论(1)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018