登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

2.6核酸数据库及核酸序列的分析(核酸序列的预测与鉴定)  

2010-12-21 11:19:14|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
2.6核酸数据库及核酸序列的分析(核酸序列的预测与鉴定)
image image

BLAST

http://www.ncbi.nlm.nih.gov/blast

ORF Finder

http://www.ncbi.nlm.nih.gov/gorf

ClustalW

http://www.ebi.ac.uk/clustalw

image
image image
image image
image image
image

完整的基因应该:符合Kozak规则

从第52bp开始的第一个起始密码子AUG上游第三个核苷酸为鸟嘌呤(G),紧跟在AUG后面的核苷酸也为鸟嘌呤(G),并且第一个AUG起始密码子前方第10bp处的同一相位出现了终止密码子UAA,AUG起始密码子前后完全符合Kozak规则:A/GNNAUGG。此外,在3′端有一个长264bp的非编码区并含有植物中典型的加尾信号G/AATAA1-3序列,在3′末段有poly(T)17 。上述特征表明该序列完全符合一个完整的基因序列。

Reference :

Kozak M. Initiation of translation in prokaryotes and eukaryotes.Gene, 1999, 234 (2): 187-208.

三、小 结

1、Genomic DNA and cDNA, 利用ORF Finder软件发现开放阅读框ORF(Open reading frame)。

网址:http://www.ncbi.nlm.nih.gov/gorf

2、编码蛋白质中的氨基酸序列蛋白质结构域预测:利用SMART(Simple Modular Rrvhitecture Research Tool)软件。

网址:http://smart.embl-heidelberg.de

3、利用ScanProsite软件,进行蛋白质基序(motif)预测

网址:http://www.expasy.org/tools/scanprosite

蛋白质基序(motif)中的x表示任意氨基酸,其中的数字表示任意几个氨基酸;[ST]表示氨基酸为S or T;{P}表示除掉P之外的任意氨基酸。

如:

ID ASN_GLYCOSYLATION; PATTERN.

AC PS00001;DT APR-1990 (CREATED); APR-1990 (DATA UPDATE); APR-1990 (INFO UPDATE).

DE N-glycosylation site.

PA N-{P}-[ST]-{P}.

CC /TAXO-RANGE=??E?V;

CC /SITE=1,carbohydrate;CC /SKIP-FLAG=TRUE;DO PDOC00001;

4、利用软件NRL-3D,进行蛋白质三维结构的预测。

网址:http://www.expasy.org/swissmod/SWISS-MODEL.html

网址:http://www.ncbi.nlm.nih.gov/structure

5、利用BLASTp软件,对GenBank数据库中进行相似性和同源性蛋白质搜索。

 

网址:http://www.ncbi.nlm.nih.gov/blast

6、 利用Genscan软件,对genomic DNA进行Promoter的预测。

网址:http://genes.mit.edu/GENSCAN.html

7 、利用RiceHMM等软件,对特定的生物种进行基因预测

网址:http://rgp.dna.affrc.go.jp/RiceHMM/index.html

8 、利用Compute pI/Mw软件,对编码蛋白质进行等电点(pI)和分子量(Mw)的预测。

网址:http://www.expasy.org/tools/pi-tool.html

9、 利用Promoter软件,对genomic DNA进行Promoter的预测。

网址:http://www.fruitfly.org/cgi-bin/seq_tools/promoter.html

10、 一个全长基因特征分析:

1)、第1个起始密码子AUG上游第3个核苷酸为鸟嘌呤(G)或腺嘌呤(A),紧跟在AUG后面的核苷酸也为鸟嘌呤(G),第1个AUG起始密码子前方同一相位出现终止密码子UAA或UAG或UGA。AUG起始密码子前后符合Kozak规则:A/GNNAUGG。

2)、 在3′端非编码区(untranslated region,UTR)有Poly(A)18、在转录终止位点附近有1个典型的加尾信号G/AATAA1-3。

  评论这张
 
阅读(1320)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018