注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

启动子分析-----------转录因子结合位点  

2010-11-30 13:03:13|  分类: noncodingRNA |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
http://jiangweihb.blog.163.com/blog/static/35666896201091633456923/

  启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。在基因表达的调控中,转录的起始是个关键。常常某个基因是否应当表达决定于在特定的启动子起始过程。启动子一般可分为两类:  

(1)一类是RNA聚合酶可以直接识别的启动子。这类启动子应当总是能被转录。但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合。

(2)另一类启动子在和聚合酶结和时需要有蛋白质辅助因子的存在。这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。  

  因此,RNA聚合酶能否与启动子相互作用是起始转录的关键问题,似乎是蛋白质分子如何能识别DNA链上特异序列。例如,RNA聚合酶分子上是否有一个活性中心能够识别出DNA双螺旋上某特异序列的化学结构?不同启动子对RNA聚合酶的亲和力各不同。这就可能对调控转录起始的频率,亦即对基因表达的程度有重要不同。DNA链上从启动子直到终止子为止的长度称为一个转录单位。一个转录单位可以包括一个基因,也可以包括几个基因。启动子预测软件大体分为三类,第一类是启发式的方法,它利用模型描述几种转录因子结合部位定向及其侧翼结构特点,它具有挺高的特异性,但未提供通用的启动子预测方法;第二类是根据启动子与转录因子结合的特性,从转录因子结合部位的密度推测出启动子区域,这方法存在较高的假阳性;另一类是根据启动子区自身的特征来进行测定,这种方法的准确性比较高。同时,还可以结合是否存在CpG岛,而对启动子预测的准确性做出辅助性的推测。

启动子预测软件有:PromoterScanPromoter 2.0 ; NNPP ;EMBOSS Cpgplot ; cript/cpg_island.html">CpG Prediction


启动子及转录因子结合位点数据库及预测工具

冷泉港启动子分析程序介绍   http://www.bioinformaticsonline.org/links/ch_09_t_6.html
 
 
在线预测和分析基因启动子(promoter)
      一般在公共数据库中,如NCBI、UCSC、Ensembl给出的人类基因序列都没有对基因进行详细的标注。不过,有很多在线工具,可以预测和分析基因序列上的启动子、内含子、UTR区等。在这里就简单总结收集一些网站,备用。
      1. NCBI上的Finding Promoter (NCBI推荐的)
      (http://www.ncbi.nlm.nih.gov/Class/NAWBIS/Modules/DNA/dna21b.html
      Promoter Scan from the Bioinformatics and Molecular Analysis section of
      NIH.
      TFSearch from the Computational Biology Research Center of Japan.
      DRAGON Gene Start Finder from the DRAGON Genome Explorer site.
      2. Promoter 2.0 Prediction Server
      (http://www.cbs.dtu.dk/services/Promoter/
      Promoter2.0 predicts transcription start sites of vertebrate PolII
      promoters in DNA sequences. It has been developed as an evolution of
      simulated transcription factors that interact with sequences in promoter
      regions. It builds on principles that are common to neural networks and
      genetic algorithms.
      3. TFSEARCH (http://www.cbrc.jp/research/db/TFSEARCH.html
      Searching Transcription Factor Binding Sites (ver 1.3)
      4. Neural Network Promoter Prediction (伯克利大学)
      (http://fruitfly.org:9005/seq_tools/promoter.html
      5. The Markov Chain Promoter Prediction Server(杜克大学)
      (http://tools.genome.duke.edu/gen ... ter/McPromoter.html)
      6. Neural Network Promoter Prediction (BIosino:中国生物信息 )
      (http://promotor.biosino.org/
      7. Core-Promoter Prediction Program (by Michael Zhang)
      (http://rulai.cshl.org/tools/genefinder/CPROMOTER/human.htm


PROMOTER FINDING AND ANALYSIS PROGRAMS ON THE INTERNET
--------------------------------------------------------------------------------
TRANSPLORER (TRANScription exPLORER)
Dnanalyze (TF mapping)
Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)
FunSiteP 2.1
HCtata (TATA signal prediction)
McPromoter Ver.3
MatInspector (Search for TF binding sites)
ModelGenerator and ModelInspector
NNPP2.1 (TSS finder)
PromoterInspector (Strand non-specific promoter region finder)
Promoter2.0 (TSS finder)
Promoter Scan II (Promoter region prediction)
RGSiteScan
Signal Scan (Search for Eukaryotic Transcriptional Elements)
TESS (Search for Transcription Elements)
TFSEARCH (Predicts TF binding sites based on TRANSFAC data)
TRANSFAC (TF database and a number of associated programs)
TSSG and TSSW
PROMOTER 2.0 http://www.cbs.dtu.dk/services/Promoter/
通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA 盒、CCAAT 盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如PROMOTER 2.0, 用神经网络方法确定TATA 盒、CCAAT盒、加帽位点(cap site) 和GC 盒(GCbox) 的位置和距离, 识别含TATA 盒的启动子。
PROMOTER SCAN       http://thr.cit.nih.gov/molbio/proscan/
根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA 盒的权重矩阵(weight matrix) 结合起来,从基因组DNA中识别出启动子区[3 ] 。但上述程序预测的假阳性率较高,PROMOTER 210 每23kb 出现一个假阳性;PRO2MOTER SCAN 平均每19kb 出现一个假阳性。
PromoterInspector http://www.genomatix.de/products/PromoterInspector/PromoterInspector2.html
另一种方法根据启动子区序列的特征进行预测。Promo2terInspector 从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3’端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位置
FirstEF    http://rulai.cshl.org/tools/FirstEF/
近来还有一些程序将上述方法与CpG 岛(CpG islands) 信息相结合。CpG岛是一段200 bp 或更长的DNA 序列,核苷酸G + C 的含量较高,并且CpG双核苷酸的出现频率占G+ C 含量的50 %以上。许多脊椎动物的启动子区都与CpG岛的位置重合。FirstEF ( http :/ / rulai1cshl1org/ tools/ FirstEF/ ) 搜索通过5’UTR 定位技术构建的第一外显子数据库,识别第一剪切点(first splicing donor site) ,结合CpG 岛信息,确定启动子区。这种方法使预测的敏感性和特异性都明显提高。该程序预测含CpG岛的启动子的敏感性和特异性都高于90 % ,预测不含CpG岛的启动子的精确性相对略低。
TRRD 数据库 http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/ 收录了真核基因调控区结构和基因表达方式的信息,每个条目对应一个基因。
应用权重矩阵数据库搜索转录因子结合部位的程序包括
SIGNAL SCAN http://thr.cit.nih.gov/molbio/signal/
MatInspector http://www.genomatix.de/products/index.html
转录因子搜索程序( transcriptional factor search ,
TF2 SEARCH ) http://www.cbrc.jp/research/db/TFSEARCH.html
等等。尽管基于PWM 的搜索比较敏感,但它最大的缺点就是假阳性率过高,在预测的结果中有很多结合部位并不真正具有生物学功能。
COMPEL 数据库 http://compel.bionet.nsc.ru/new/index.html
经实验确定的复合元件不多,COMPEL 数据库中收录了近200 条经实验确定的复合元件的信息。如果转录因子结合部位的预测结果中包含复合元件,显然比单个元件更有可能具有生物学功能。Co - Bind 程序通过建立两个转录因子结合部位的PWM 及其复合作用的模型,可以预测序列中的复合元件。还有一些程序利用COMPEL 数据库中已知的复合元件去搜索基因组序列。
Consensus ftp://beagle.colorado.edu/pub/consensus/
AlignACE http://atlas.med.harvard.edu/cgi-bin/alignace.pl
等是用来搜索高含量基序(overrepresented motif finding) 的一些算法,可以对一组基因簇中的基因调控区进行比较,以发现其中存在的高含量的基序,调控元件可能就存在于这些基序之

  评论这张
 
阅读(2924)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016