登录  
 加关注
查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

Weblogo等motifs可视化  

2009-12-07 20:25:05|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 http://weblogo.berkeley.edu/logo.cgi

蛋白结合位点常常是以“共有性序列”(consensus  sequences)表示的,比如说TATA(A/T)A(A/T),这种方式表述了在任意位置的大部分核苷酸,但是没有说明清楚许多可变的情况。因此,人们发明了多种序列表述方法。

       早在1991年,美国健康研究院NIH生物学家Tom  Schneider发明了一种可变的,图标形式的记录方法:sequence  logos。他利用每个位置的高度来表示其保守程度,这样特征高度就反映了相对的变化频率,比如说一个consensus  sequence位置上可能是C或者T,sequence  logos上C的高度代表了其通常比T出现的频率多5倍。

        但是之后有些科学家比如来自加州大学伯克利分校的Steven  Brenner认为Schneider的这种方法“非常不适合生物学家运用”,因此在1994年,一位从英国剑桥大学的研究生Brenner发明了一种称之为Weblogo的序列表述Web版本,这一方法经过了他10年的时间完善,在2004年终于得以公布。

        这个Weblogo基于多序列比对信息,把多序列的保守信息通过图形表示出来。每个logo由一系列碱基(氨基酸)组成,在每一个序列位置上用总高度表示此位置上的序列保守性,用碱基(氨基酸)字母的高度表示出现的频率。比较于sequence  logos方法,Weblogo改进了特异fonts产出的能力——可以从position  weight  matrices而不是aligned  sequences建立logo,并且也将基因组序列偏爱性(比如GC含量)考虑在内。


其他的软件还有:

http://plogo.uconn.edu/

http://code.google.com/p/icelogo/

  评论这张
 
阅读(1661)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018