登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

Blast程序本地化使用的方法  

2009-12-09 11:02:28|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Blast程序本地化使用的方法(2008-03-25 20:09:03)

标签:生物信息学 blast 本地化  分类:生物专业 (bio)

Blast程序的下载地址: 

ftp://ftp.ncbi.nlm.nih.gov/blast/executables/release/2.2.9/blast-2.2.9-ia32-win32.exe

 

数据库的下载

ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/

 

其中 nr.gz 为非冗余的数据库,nt.gz 为核酸数据库

month.nt.gz 为最近一个月的核酸序列数据。

 

下载完后,blast-2.2.9-ia32-win32.exe 为自解压文件,双击运行后,在当前目录中会释放许多程序。

 

下载的month.nt.gz先用winrar解压缩。得到 month.nt 然后使用formatdb.exe对数据库进行格式化。

在MS-DOS环境下,输入formatdb.exe -i month.nt -p F -o T

 -i input file 参数用于指定需要格式的数据库

 -p type of file 用于指定文件类型,T 为蛋白质,F为核酸,默认为 T

 -o parse options 用于指定是否解析序列ID并创建索引 T 为创建,F为不创建,默认为F。

 

接着就是blastall.exe 的使用

先找到要对比的序列,这里是从程序包使用说明中拿来的一段FASTA格式的序列作为测试序列。

 

 >Test

AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC

TTCTGAACTGGTTACCTGCCGTGAGTAAATTAAAATTTTATTGACTTAGGTCACTAAATACTTTAACCAA

TATAGGCATAGCGCACAGACAGATAAAAATTACAGAGTACACAACATCCATGAAACGCATTAGCACCACC

ATTACCACCACCATCACCATTACCACAGGTAACGGTGCGGGCTGACGCGTACAGGAAACACAGAAAAAAG

CCCGCACCTGACAGTGCGGGCTTTTTTTTTCGACCAAAGGTAACGAGGTAACAACCATGCGAGTGTTGAA

GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCTGCGTGTTGCCGATATTCTGGAAAGCAATGCC

AGGCAGGGGCAGGTGGCCACCGTCCTCTCTGCCCCCGCCAAAATCACCAACCACCTGGTGGCGATGATTG

AAAAAACCATTAGCGGCCAGGATGCTTTACCCAATATCAGCGATGCCGAACGTATTTTTGCCGAACTTTT

 

将此段序列保存为test.txt 置于程序目录下。

 

然后在DOS窗口下,

使用 blastall -p blastn -d month.nt -i test.txt -o out.txt

-p program name 为需要使用的程序名

   blastn 为核酸序列对比搜索

   blastp 为蛋白质序列对比搜索

   blastx 为用被翻译的核酸序列在蛋白质数据库中搜索

   tblastn 为 用蛋白质序列在 [核酸序列翻译后数据库] [**1]中搜索

   tblastx 为用翻译后的核酸序列 在 核酸序列翻译后数据库中搜索

  注:[**1]原英文为 translated nucleotide database 意思为,将核酸序列通过计算机翻译为对应的蛋白质序列而形成的数据库,此处我自己水平有限,不知道该怎么正确翻译,特此注明。

 

-d database name 指定所使用的数据库名称

-i input file 待搜索的序列文件

-o output file 指定保存结果的文件

 

即可在out.txt中得到相应的结果。

 

此外,之前由于在使用formatdb.exe 使 没有使用 -o T 参数,导致没有生成索引文件,出现了以下错误提示:

[NULL_Caption] WARNING: Test: Could not find index files for database month.nt

在此说明,希望能对以后遇到和我一样错误的人,一个正确的解决办法,那就是在使用formatdb.exe时,不要忘了-o 参数,因为这个参数默认是不创建索引的,另外数据库的类型不要弄错

  评论这张
 
阅读(1412)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018