为什么样本标准差使用被称为自由度的n-1
自由度的定义:
“自由度(degrees of freedom)”指的是,在一定的约束条件下,样本所能提供的独立的信息个数
考虑样本量为n的样本(n个数),如果我们知道样本均值,那么我们只需要知道前n-1个数,就可以得知全部信息,因为最后一个数可以借助均值计算得出。所以,在给定样本均值(约束条件)的情况下,我们相当于在原本n个数的基础上消减了一个自由度,样本提供的信息只有n-1个独立的部分
当样本数据的个数为n时,若样本平均数 x拔 确定后,则附加给n个观测值的约束个数就是1个,一次只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。按照这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k。例如假设样本有3个值,即x1=2,x2=4,x3=9,则当 x拔 =5确定后,x1、x2、x3只有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3必然取2,而不能取其他值。
标准差怎么算
样本方差自由度为什么为n-1呢,因为在计算离差平方和 ∑(xi -x)2 时,必须先求出样本平均数 x拔,而 x拔 则是附加给 ∑(xi -x)2 的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个。