一、 GENSCAN是一个什么样的软件?
GENSCAN是美国麻省理工大学的Chris Burge于1997年开发成功的人类(或脊椎动物)基因预测软件,它根据基因的整体结构进行基因预测,不依赖于已有的蛋白库,是一种"从头预测"软件。目前Chris Burge还开发了适用于果蝇、拟南芥菜、玉米的专用版本。对于非版本专用的物种,其预测准确率会下降。
二、 GENSCAN用于人类(或脊椎动物)基因预测的准确率?
根据作者Chris Burge本人的数据,对特定核苷酸预测的校正准确率为91%,对外显子的平均准确率为80%。
三、 GENSCAN用于无脊椎动物和植物基因预测的准确率?
用脊椎动物版本进行基因预测的准确率
物种 | 检验序列数 | 核苷酸的校正准确率 | 外显子的平均准确率 |
果蝇 | 202 | 89% | 68% |
玉米 | 42 | 90% | 69% |
拟南芥菜 | 120 | 78% | 66% |
用特定物种版本预测的准确率
物种 | 检验序列数 | 核苷酸的校正准确率 | 外显子的平均准确率 |
玉米 | 42 | 86% | 84% |
拟南芥菜 | 120 | 78% | 69% |
四、 GENSCAN可能出现的误差:
1. 基因数目
可能将两个基因的外显子归并到一个基因,或者相反。
2. 物种
GENSCAN主要是针对人类(或脊椎动物)基因组序列设计,用于其他物种准确性可能降低。目前有适用于果蝇、玉米、拟南芥菜、秀丽线虫的版本。原核生物和酵母的基因预测,建议用Glimmer或GeneMark软件。
3. 根据测试集得到的准确性指标可能与实际的情况不同
4. 对各个结构元件的预测准确性不同
总体来说,对中间外显子预测的准确性高于起始外显子和末端外显子,外显子的准确性高于polyA或启动子。对启动子的预测较不可靠,建议用NNPPprogram 预测启动子。
5. 植物基因剪接位点的预测建议用SplicePredictor程序
五、 外显子可能性大小(P值)的含义及应用:
1. 可能性极高的外显子(e.g., P>0.99):
预测结果几乎完全与实际吻合,可放心采用。
2. 中等可能性的外显子(0.50
评论