http://www.lnsts.com/dvnews/list.aspx?cid=18 统计知识
一、反映数据集中趋势的常用统计量
1.众数(Mode)
将数据按从大到小顺序排列后,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。
2.中位数(Median)
将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,(N+1)/2;
当样本数为偶数时,N/2
与此类似的还有:
四分位数(Quartitles)、百分位数(Percentile)、十分位数(Decile)
3.均值(Mean)
(1)算术平均数,是数据集中趋势的最主要测量值。
(2)几何平均(Geometric Mean)
在计算社会经济问题的平均发展速度方面具有很重要的作用,是n个变量值连乘积的n次方根。适用于现象的总比率是若干个比率的连乘积,或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均速度。
(3)倒数平均(调和平均)(Harmonic Mean)
对观察值取倒数后用数额xifi进行加权平均,主要适用于无法直接计算均值的特殊情况。
例:三种商品单价分别为30元、50元、80元,现各购进1万元,则三种商品的平均价格为:
(4)切尾均值(Trimmed Mean)
切掉数据大小两端的若干数值计算中间数据的均值,适用于电视大奖赛、体育比赛等需要进行综合评价的竞赛项目,即去掉最高分和最低分。
(5)移动平均(Moving Average Method)
通过扩大原时间序列的时间间隔,并按一定的间隔长度逐期移动,分别计算某一序列的移动平均数,由这些移动平均数形成的新的时间数列对原数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。
二、反映数据分布离散程度的测定
1.极差(Range):数据最大值和最小值之差
2.方差(Variance)
主要用来反映数据的离散程度,公式为
标准差是方差的正平方根,公式为
3.离散系数(Coefficient of Variation)
用来对两组数据的差异程度进行比较,剔除均值大小不等的影响。公式为
评论