BLAST http://www.ncbi.nlm.nih.gov/blast ORF Finder http://www.ncbi.nlm.nih.gov/gorf ClustalW http://www.ebi.ac.uk/clustalw | |
完整的基因应该:符合Kozak规则 从第52bp开始的第一个起始密码子AUG上游第三个核苷酸为鸟嘌呤(G),紧跟在AUG后面的核苷酸也为鸟嘌呤(G),并且第一个AUG起始密码子前方第10bp处的同一相位出现了终止密码子UAA,AUG起始密码子前后完全符合Kozak规则:A/GNNAUGG。此外,在3′端有一个长264bp的非编码区并含有植物中典型的加尾信号G/AATAA1-3序列,在3′末段有poly(T)17 。上述特征表明该序列完全符合一个完整的基因序列。 Reference : Kozak M. Initiation of translation in prokaryotes and eukaryotes.Gene, 1999, 234 (2): 187-208. 三、小 结 1、Genomic DNA and cDNA, 利用ORF Finder软件发现开放阅读框ORF(Open reading frame)。 网址:http://www.ncbi.nlm.nih.gov/gorf
2、编码蛋白质中的氨基酸序列蛋白质结构域预测:利用SMART(Simple Modular Rrvhitecture Research Tool)软件。 网址:http://smart.embl-heidelberg.de | |
3、利用ScanProsite软件,进行蛋白质基序(motif)预测 网址:http://www.expasy.org/tools/scanprosite 蛋白质基序(motif)中的x表示任意氨基酸,其中的数字表示任意几个氨基酸;[ST]表示氨基酸为S or T;{P}表示除掉P之外的任意氨基酸。 如: ID ASN_GLYCOSYLATION; PATTERN. AC PS00001;DT APR-1990 (CREATED); APR-1990 (DATA UPDATE); APR-1990 (INFO UPDATE). DE N-glycosylation site. PA N-{P}-[ST]-{P}. CC /TAXO-RANGE=??E?V; CC /SITE=1,carbohydrate;CC /SKIP-FLAG=TRUE;DO PDOC00001; 4、利用软件NRL-3D,进行蛋白质三维结构的预测。 网址:http://www.expasy.org/swissmod/SWISS-MODEL.html 网址:http://www.ncbi.nlm.nih.gov/structure 5、利用BLASTp软件,对GenBank数据库中进行相似性和同源性蛋白质搜索。 |
网址:http://www.ncbi.nlm.nih.gov/blast 6、 利用Genscan软件,对genomic DNA进行Promoter的预测。 网址:http://genes.mit.edu/GENSCAN.html 7 、利用RiceHMM等软件,对特定的生物种进行基因预测 网址:http://rgp.dna.affrc.go.jp/RiceHMM/index.html 8 、利用Compute pI/Mw软件,对编码蛋白质进行等电点(pI)和分子量(Mw)的预测。 网址:http://www.expasy.org/tools/pi-tool.html 9、 利用Promoter软件,对genomic DNA进行Promoter的预测。 网址:http://www.fruitfly.org/cgi-bin/seq_tools/promoter.html 10、 一个全长基因特征分析: 1)、第1个起始密码子AUG上游第3个核苷酸为鸟嘌呤(G)或腺嘌呤(A),紧跟在AUG后面的核苷酸也为鸟嘌呤(G),第1个AUG起始密码子前方同一相位出现终止密码子UAA或UAG或UGA。AUG起始密码子前后符合Kozak规则:A/GNNAUGG。 2)、 在3′端非编码区(untranslated region,UTR)有Poly(A)18、在转录终止位点附近有1个典型的加尾信号G/AATAA1-3。 |
评论