登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

简约信息位点  

2010-08-13 23:19:04|  分类: 进化与系统学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
最大简约法(Maximum Parsimony)最早是基于形态特征分类的需要而发展起来的,具体的算法有许多版本,其中有些已被广泛地用于分子进化研究中,根据离散特征数据构建系统发生树。最大简约法的目标是构造一棵反映分类单元之间最小变化的系统发生树。最大简约法利用的只是对简约分析能提供信息的特征,如在DNA序列数据中,利用的只是存在于核苷酸序列差异(至少有两种不同类型的核苷酸)的位点,这些位点称为简约信息位点(parsimony informative site)。具体来说,信息位点就是指能由位点产生的突变数目把一棵树与其它树区分开来的位点。如果对于某个位点,所有序列都有同样的字符,则这个位点称为不变位点(invariant)。显然不变位点是非信息位点(uninformative site)。如果一个位点是信息位点,那么它至少有两种不同的核苷酸,并且这些核苷酸至少出现两次。所有的简约法程序在开始时都将这条简单的规则应用于输入数据集。显然,表6.5中位点6 是非信息位点,该位点将被舍弃,在简约法分析中不再被考虑。但是,非信息位点对基于距离的方法中两两相似度的得分有贡献,仅这一点差别就可能使这两类方法产生的结果有很大的不同。


信息位点是指那些至少存在2个不同核苷酸且每个不同核苷酸至少出现两次的位点。

假定有四条序列 i,j,k,l(当然也可能是更多的序列比对)

i : AGGGTAACTG
j : ACGATTATTA
k: ATAATTGTCT
l : AATGTTGTCG
序号:12345 678910
4,7,9位点即为信息位点,只有序列中有信息位点才可以用最大简约法建树。
1位点全为A,5位点全为T,核苷酸没有发生变异,而除1,5位点外均为核苷酸变异位点。
  评论这张
 
阅读(1316)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018