登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

反映数据集中趋势和分布离散程度的常用统计指标  

2010-01-12 14:37:01|  分类: 数理统计 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

http://www.lnsts.com/dvnews/list.aspx?cid=18    统计知识

 

一、反映数据集中趋势的常用统计量

1.众数(Mode)

将数据按从大到小顺序排列后,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。

2.中位数(Median)

将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,(N+1)/2;

当样本数为偶数时,N/2

与此类似的还有:

四分位数(Quartitles)、百分位数(Percentile)、十分位数(Decile)

3.均值(Mean)

(1)算术平均数,是数据集中趋势的最主要测量值。

(2)几何平均(Geometric Mean)

在计算社会经济问题的平均发展速度方面具有很重要的作用,是n个变量值连乘积的n次方根。适用于现象的总比率是若干个比率的连乘积,或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均速度。

(3)倒数平均(调和平均)(Harmonic Mean)

对观察值取倒数后用数额xifi进行加权平均,主要适用于无法直接计算均值的特殊情况。

例:三种商品单价分别为30元、50元、80元,现各购进1万元,则三种商品的平均价格为:

反映数据集中趋势和分布离散程度的常用统计指标 - fhqdddddd - 流浪云南

(4)切尾均值(Trimmed Mean)

切掉数据大小两端的若干数值计算中间数据的均值,适用于电视大奖赛、体育比赛等需要进行综合评价的竞赛项目,即去掉最高分和最低分。

(5)移动平均(Moving Average Method)

通过扩大原时间序列的时间间隔,并按一定的间隔长度逐期移动,分别计算某一序列的移动平均数,由这些移动平均数形成的新的时间数列对原数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。

二、反映数据分布离散程度的测定

1.极差(Range):数据最大值和最小值之差

2.方差(Variance)

主要用来反映数据的离散程度,公式为

反映数据集中趋势和分布离散程度的常用统计指标 - fhqdddddd - 流浪云南

标准差是方差的正平方根,公式为

反映数据集中趋势和分布离散程度的常用统计指标 - fhqdddddd - 流浪云南

3.离散系数(Coefficient of Variation)

用来对两组数据的差异程度进行比较,剔除均值大小不等的影响。公式为

反映数据集中趋势和分布离散程度的常用统计指标 - fhqdddddd - 流浪云南

  评论这张
 
阅读(5836)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018