注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

超几何分布  

2012-09-28 09:49:43|  分类: 数理统计 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
超几何分布在生物学中有重要应用,常被用来做各种富集分析,同时它和Fisher精确检验有着千丝万缕的联系,掌握超几何分布是编写Fisher精确检验的基础。

在R语言中dhyper四个参数的含义分别如下:
x: the number of white balls drawn without replacement from an urn which contains both black and white balls.
m: the number of white balls in the urn
n: 
the number of black balls in the urn
k:  number of balls drawn from the urn

在scipy中stats.hypergeom.pmf (cdf, sf)等大多数均可接受4个参数,但是与dhyper的四个参数不一样,了解它们的差异才能让我们更好地去掌握和应用。

有以下2乘2列联表
=========
a=2    b=23
c=5    d=30
=========
(注:该例子来自【美】伯纳德.罗斯纳 著  孙尚拱 译  《生物统计学基础》第五版) P355.
1. Probability mass function (pmf)
求观测到次2乘2列联表的精确概率?为明确2乘2列联表中a,b,c,d意义,先将其映射为上述提到的x,m,n,k:
x=a            x=2
m=a+b       m=2+23=25
n=c+d        n=5+30
k=a+c         k=2+5=7
在R语言中:
>dhyper(x, m, n, k)
[1] 0.2521695

在Python的Scipy中:
from scipy import stats
>>>stats.hypergeom.pmf(a, a+b+c+d, a+b, a+c)
0.25216948468971595

>>>stats.hypergeom.pmf(x, m+n, m, k)
0.25216948468971595

2. Cumulative distribution fuction (cdf)
Scipy中的stats.hypergeom.cdf(x, m+n, m, k)相当于R中的phyper(x, m, n, k)
>phyper(x, m, n, k)
0.3746518
>>>stats.hypergeom.cdf(x, m+n, m, k)
0.37465180582472224

Scipy中的stats.hypergeom.sf(x, m+n, m, k)相当于R中的phyper(x, m, n, k, lower.tail=FALSE)
>phyper(x, m, n, k, lower.tail=FALSE)
[1] 0.6253482
>>>stats.hypergeom.sf(x, m+n, m, k)
0.62534819417527776

3.求cdf的反函数在某一个点的值
>qhyper(0.95, m, n, k)
[1] 5
>>>stats.hypergeom.ppf(0.95, m+n, m, k)
5.0

4.从超几何分布中产生一系列的随机变量
例如产生6个随机变量
>rhyper(6, m, n, k)
>>>np.random.hypergeometric(k, m+n, m, 6)

  评论这张
 
阅读(2129)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016