注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

如何在本地BLAST【转】  

2011-01-12 08:42:05|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |


1. 下载Standalone BLAST executables
下载地址: http ftp
注意下载和你的系统对应的文件
2. 解压
以下步骤针对于linux操作系统,windows操作系统的方法请参考解压后的doc文件夹的index.html文件
3. 创建一个名为.ncbirc的文件
内容如下:
[NCBI]
Data=”path/data/”
其中,”path/data/”是Standalone BLAST程序data子目录的位置。如: Data=/root/blast/data
.ncbirc文件应保存在你调用Standalone BLAST程序的目录或者你的根目录
4. 创建BLAST database
下载或者收集BLAST搜索的数据库,通常是核酸序列或蛋白质序列,
通过Standalone BLAST程序的formatdb命令把这些序列格式化。如:
formatdb -i db -o F -p F -n “nr” -v 2000000000
各选项意义如下:
-i 输入文件,只能是一个文件,
-o Parse options (默认是F)
T – True: Parse SeqId and create indexes.
F – False: Do not parse SeqId. Do not create indexes.
Update: 如果需要用fastacmd通过SeqId获取序列,则必须使用-o选项;
如果只是BLAST,不需要获取BALST得到的序列,则不使用-o选项
-p 文件类型 (默认是T)
T – protein
F – nucleotide [T/F] Optional
-n 数据库名称
不指出的话默认为输入文件名
-v 数据库每卷大小(单位是百万字母) (默认是0)
这个选项把大的FASTA文件分割成卷,每卷大小由-v后的参数指定,不超过2000000000,即20亿字母。
更多选项请参阅 解压后的doc文件夹的formatdb.html文件或者man formatdb
关于错误解决方法,请参阅http://bioinformatics.ubc.ca/resources/tools/formatdb
5. 开始BLAST!
大家熟悉的”blastp”, “blastn”, “blastx”, “tblastn”, 或 “tblastx” 都通过Standalone BLAST程序的formatdb命令实现。
格式是:
blastall -p blastn -d nr -i QUERY -o out.QUERY -m 9
各选项意义如下:
-p 程序名
包括 blastp: 通过蛋白质序列搜索蛋白质序列数据库
blastn: 通过核酸序列搜索核酸数据库
blastx: 通过翻译后的核酸序列搜索蛋白质数据库
tblastn: 通过蛋白质序列搜索翻译后的核酸数据库
tblastx: 通过翻译后的核酸序列搜索翻译后的核酸数据库
-d 数据库名称
与formatdb中-n选项一致
-i 输入文件
不指明的话默认为STDIN
-o 输出文件
不指明的话默认为STDOUT
-m (blast2, blastall, blastall_old, blastcl3, blastpgp,impala, megablast, rpsblast)显示选项:
0 pairwise (default)
1 query-anchored showing identities
2 query-anchored, no identities
3 flat query-anchored, show identities
4 flat query-anchored, no identities
5 query-anchored, no identities and blunt ends
6 flat query-anchored, no identities and blunt ends
7 XML Blast output (not available for impala)
8 tabular (not available for impala)
9 tabular with comment lines (not available for impala)
10 ASN.1 text (not available for impala or rpsblast)
11 ASN.1 binary (not available for impala or rpsblast)
-T 输出html格式的文件
更多选项请参阅 解压后的doc文件夹的formatdb.html文件,或者man blast
6. Standalone BLAST程序还带有其他命令,如
bl2seq: 比较2个序列相似性
megablast: 高度相似性核酸序列BLAST
等等
详情请参阅 解压后的doc文件夹,或者man blast
2009.9.3 Update:
BENM同学也写了一系列BLAST教程,很好很详细,大家可以参考下:
Blast使用方法攻略(一)
Blast使用方法攻略(二)
Blast使用方法攻略(三)
  评论这张
 
阅读(2637)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016