计算全距、平均差、方差标准差
计算全距、平均差、方差和标准差
一、全距R(range)
全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。
R=Xmax-Xmin
一般用于研究的预备阶段,用它检查数据的分布范围,以便确定如何进行统计分析
原始数据计算公式
三、四分位差(Quartile)
四分位差是第一个四分位数与第三个四分位数之差计算公式为
Q=Q3-Q1
四、方差与标准差
方差:又称为变异数、均方,是每个数据与该组数据平均数之差乘方后的均值,是表示一组数据离散程度的统计指标。
样本的方差用表示,总体的方差用表示。
标准差是方差的算术平方根。一般样本的标准差用S 表示,总体的标准差用表示。
标准差和方差是描述数据离散程度的最常用的差异量。
分组数据方差与标准差的计算公式
方差与标准差的性质
方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。
标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:
总体方差、标准差或者方差、标准才差的合成
方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。
需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。
方差和标准差的优点:
方差与标准差是表示一组数据离散程度的最好指标,其值越大,离散程度越大。
应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。
优点:
反应灵敏。每个数据发生变化,方差与标准差也随之变化
有一定计算公式的严密确定
容易计算
受抽样变动的影响小
简单明了
方差具有可加性(区分变异源,组间/组内)
五、差异系数(coefficient of variation)
差异系数指标准差与其算术平均数的百分比,它是没有单位的相对数。用CV表示。
何种情况下运用差异系数:
两个或两个以上样本所测特质不同,即所使用的观测工具不同,如何比较两者的离散程度
即使使用同一种观测量具,但样本水平相差较大,如何比较其离散程度
差异系数的作用
比较不同单位资料的差异程度
比较单位相同而平均数相差较大的两组资料的差异程度
可判断特殊差异情况
根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。
六、标准分数(standard score)
1、概念
标准分数,又称为基分数或Z分数(Z-score),是以标准差为单位,反映一个原始分数在团体中所处位置。具体来说,Z分数表示原始分数在以平均数为中心时的相对位置。
标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。
Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。
2、计算
把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。
线性变换
标准分数带有小数和负值,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。
例如:早期智力测验中运用智力商数表示智力测查的指标标准差怎么算
这种表示智力的方法后来被离差智商取代:
标准分数的性质
Z分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。一组原始分数得到的Z分数既有正值,也有负值,所有原始分数的Z分数之和为零。
一组原始数据中,各个Z分数的标准差为1。
标准分数的应用
用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。
表示标准测验分数。经过标准化的心理和教育测验,常常用标准分数表示测验结果。
标准分数的优点
可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。
可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。
明确性:标准分数较原始分数的意义更为明确。
合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实。
七、百分位数与百分位差
把一个次数分布排序后,分为100个单位。百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。
百分位数用P m表示
百分位差(距)
百分位差是指两个百分位数(percentile)之差。
常用的百分位距有两种:
P90-P10和P93-P7。
第三节数据的分布形状
一、正态分布
二、偏态系数(skewness SK)
当数据较多的出现在均值的一侧时,数据分布左右不对称,此时,数据分布称为偏态分布。
描述变量非对称分布的数字特征是偏态系数,也称为偏度。
偏态分布有正偏态分布和负偏态分布两种。当N>200以上时,计算的偏态系数才是可靠的。SK>0为正偏态,SK<0为负偏态,SK=0 为正态。如果偏态系数的绝对值大于1,则说明数据的分布与正态分布有明显的不同
三、峰态系数(kurtosis Ku)
Ku以为判断值,小于为高狭峰,大于为低阔峰
四、偏态系数与峰态系数的计算方法
1、皮尔逊偏态量数法
2、峰度、偏度检验法