[摘 要]本文全面地介绍了估计总体标准差的7种主要统计方法:贝塞尔公式法(最为常用)、彼得斯公式法、极差法、最大误差法、最大残差法、较差法和最大方差法。系统地研究了各种估计总体标准差统计方法的由来和原理,严谨地推导出了其标准差系数的计算公式。根据标准差系数大小所反映出的测量精密度高低可分析比较出各种估计总体标准差统计方法的优劣及其适用范围。
[关键词]总体标准差;参数估计;无偏估计;系统误差;随机误差;综合误差;测量不确定度;自由度;标准差系数
7.4 最大误差法
最大误差法(maximum error method) [1-3] 是1975年由中国计量科学研究院学者刘智敏(1935.07—)在《用最大误差评定精度的原理和应用》一文中首先提出并研究的,它只适用于已知被测量真值(约定真值或相对真值)时的情形。
设 X 1,X 2,…,X n(n≥1)为独立地抽自总体X~N(0,σ2)的随机样本,此时随机误差
δ i=x i-A=x i- μ= x i,标准差怎么算 即测量值x 1, x 2, …, x n本身就是随机误差。
令 ε n= max 1≤i≤n X i = max 1≤i≤n ( X 1 , X 2 , …, X n ) ,则称ε n为样本X n的最大绝对误差,简称最大误差。用最大误差法估计总体标准差的计算公式为:
因X i~N(0,σ2),故随机变量 Y= X i 的分布函数和概率密度分别为:
故随机变量 ε n= max 1≤i≤n X i 的分布函数和概率密度分别为:
随机变量 ε n= max 1≤i≤n X i 的数学期望和方差分别为:
数学期望系数 k n= 2n 2 π ∫ ∞ 0 εe - ε2 2 2 2 π ∫ ε 0 e - x2 2 dx n-1 dε
均方差系数 k′ n= q n-k2 n
当 n=1时,有:
当 n=2时,有:
当n≥2时,除k 2以外,其他的k n和q n无法用牛 顿─ 莱布尼兹公式直接求出其定积分值,为
此采用4σ截尾法进行近似计算,将等分为8段,每段利用辛普森公式[又称抛物线公式、三点公式,是牛顿─科特斯(英国数学家, Roger Cotes ,1682―1716)公式中 n= 2时的特例]积分,从而可计算出k n、q n和k′ n的值。采用4σ截尾法计算k n和q n的截尾误差分别小于0.0026n和0.0009n。
因 =ε n/k n 是σ的无偏估计,没有系统误差,其标准差系数为:
定义修正后贝塞尔公式法和最大误差法两种统计估计方法的相对效率为:
最大误差法自由度的估计值为:
最大误差法和贝塞尔公式法的标准差系数比较和相对效率如表7.4-1所示。
表7.4-1 最大误差法和贝塞尔公式法的标准差系数比较和相对效率
注1:本列括号内的数据源自文献[1]第48页,其值不太准确。笔者利用该文献中介绍的计算方法和表1中的数据对本表中的 k n和k′ n值重新进行了计算核实并补齐了n≤30时的各k′ n值。
关于最大误差法(与贝塞尔公式法相比)的特点和结论:①最大误差法只适用于已知被测量真值(约定真值或相对真值)且方差是正态分布时的情形。②最大误差法的运算十分简便,一般只适用于小样本数(n≤10)时的情形。③在代价较高的科学实验中(如破坏性实验),往往只能进行一次性实验(即样本数n=1),此时贝塞尔公式和彼得斯公式都成为0/0不定型而无法计算出其标准差。在这种情况下,为了尽可能精确地估算出其精密度,只能选用最大误差法,这是其最突出的特点和优势。④当n≤8时,最大误差法优于修正前贝塞尔公式法。C n(ME) -ψ Bn 的最小值出现在n=2时,其最大值出现在n=29时,该值最终趋近于零。⑤当n≤5时,最大误差法优于修正后贝塞尔公式法。C n(ME) -C n(B) 的最小值出现在 n= 2时,其最大值出现在n=29时,该值最终趋近于零。 ⑥当 n≤5时,修正后贝塞尔公式法和最大误差法的估计相对效率高于100%;当n=6~10时,修正后贝塞尔公式法和最大误差法的估计相对效率不低于77%,随着n的增大,其相对效率急速下降(比极差法的下降速率还要快)且最终趋近于零。
7.5 最大残差法
若被测量约定真值未知,第7.4节所描述的最大误差法便失效了,为此需要引入最大残差法。
最大残差法 (maximum residual error method) [4-9] 是1979年由中国计量科学研究院学者刘智敏在《评定精度的最大残差法》一文中首先提出并研究的。
设X 1,X 2,…,X n(n≥2)为独立地抽自总体X~N(μ,σ2)的随机样本,残差 v i=x i- ,令 ξ n= max 1≤i≤n V i = max 1≤i≤n ( V 1 , V 2 , …, V n ) ,则称ξ n为样本X n的最大绝对残差,简称最大残差。在最大误差法中,用 max 1≤i≤n v i 来代替 max 1≤i≤n δ i ,则用最大残差法估计总体标准差的计算公式为:
若随机变量Y=aX+b(a≠0),X~N(μ,σ2),则Y~N(b+aμ,a2σ2),即多个相互独立的正态分布随机变量的线性变换仍服从正态分布,故残差序列(V 1, V 2,…, V n)服从正态分布。根据残差的性质 n i=1 v i=0 可得 v n=- n-1 i=1 v i ,故(V 1,V 2,…,V n)服从退化的n-1维正态分布,因此下面只研究随机向量(V 1,V 2,…,V n-1 )的分布情况。随机向量(V 1,V 2,…,V n-1 )的联合概率密度为:
上式中, M jk 为 M 中元素 m jk 的代数余子式,其他各符号的含义分别是:
①M为随机向量(V 1,V 2,…,V n-1 )的协方差矩阵(属对称矩阵),M -1 为其逆矩阵,即:
上式中的M ij (i&j=1,2,…,n-1)为随机向量(V 1,V 2,…,V n-1 )的二阶中心矩,即:
上式中ρ ij 为随机变量V i和V j之间的相关系数。
②X和μ为如下的列矩阵:
(X-μ)′为矩阵(X-μ)的转置矩阵,即:
因随机变量X i和 之间的相关系数为 1 n ,故由 V i=X i- 可知随机变量V i的标准差为:
随机变量V i和V j(i≠j, i&j=1,2,…,n)之间的相关系数为 - 1 n-1 ;当i=j时,随机变量V i和V j之间的相关系数则为1。
考虑到E(V i)=0,还有:
由上述结论可以得出随机向量(V 1,V 2,…,V n-1 )的(n-1)×(n-1)阶协方差矩阵为:
方阵M的行列式值 M = n-1 n σ2+ 1 n σ2 n-2 n-1 n σ2+(n-2) - σ2 n = σ 2(n-1) n
当i=j时,显然诸代数余子式A ij 相等,且:
当i≠j时,由于方阵M的对称性,诸代数余子式A ij 也相等,且:
由此可得随机向量 (V 1, V 2, …, V n-1 ) 的(n-1)×(n-1)阶协方差逆矩阵为:
随机向量(V 1,V 2,…,V n-1 )的联合概率密度和联合分布函数分别为:
故总体X~N(μ,σ2)时 max 1≤i≤n V i σ 的分布函数(概率密度)与总体X~N(μ,1)时 max 1≤i≤n V i 的分布函数(概率密度)相同。又因V i与μ无关[10],故亦与总体X~N(0,1)时 max 1≤i≤n V i 的分布函数(概率密度)相同。
设X i~N(0,1)时,随机变量 ξ n= max 1≤i≤n V i 的分布函数、概率密度、数学期望和方差分别为F 0n (ξ n)、f 0n (ξ n)、r 0n 和r′2 0n ,则X i~N(μ,σ2)时,随机变量 ξ n= max 1≤i≤n V i = max 1≤i≤n X i- 的分布函数、概率密度、数学期望和方差满足如下关系:
均方差系数 r′ n= s n-r2 n
当n=2时, f(v 1)= 1 π e -v2 1 ,即 V 1~N(0, 2 2 )
因V 2= -V 1,故 ξ 2= max 1≤i≤2 V 1 = V 1 = V 2 的概率密度为:
f 02 (ξ 2)=2f(ξ 2)= 2 π e -ξ2 2 , 即随机变量ξ 2满足σ= 2 2 的反射正态分布[11]。
反射正态分布是自由度为1(即n=1)时的χ-分布的特例,常应用于误差分析理论;n=2时的χ-分布称为瑞利分布,常应用于随机噪声理论;n=3时的χ-分布则称为麦克斯韦分布,在统计物理学(又称统计力学)中常应用于描述处于平衡态的大量气体分子运动的绝对速度的分布(1859年,即麦克斯韦速率分布律)。
当n≥3时,r n和s n无法用牛顿─莱布尼兹公式直接求出其定积分值,借助计算机通过蒙特卡罗法( Monte Carlo method,又称统计模拟法、统计试验法、计算机随机模拟方法、随机抽样技术)并结合Matlab 数学软件可近似计算出 F 0n (ξ n)、 r 0n (r n)、 s n和r′ 0n (r′ n) 的值。
因 =ξ n/r n 是σ的无偏估计,没有系统误差,其标准差系数为:
定义修正后贝塞尔公式法和最大残差法两种统计估计方法的相对效率为:
且 lim n→∞ e n(B·MR) =0
最大残差法自由度的估计值为:
最大残差法和贝塞尔公式法的标准差系数比较和相对效率如表7.5-1所示。
表7.5-1 最大残差法和贝塞尔公式法的标准差系数比较和相对效率 注1
续 表
注1: 最大残差法时的有关数据请参见文献[12]第510页中的“附表7 标准正态分布最大残差的分布函数F 0、期望E 0、标准差σ 0表”,它与本表中的数据存在一些差异。
注2:本列数据源自文献[9]第204页。
注3:本列数据源自文献[13]第265~266页,其中表12-5中将n=23时的E 0误写为2.12(正确数据是2.17)。
关于最大残差法(与贝塞尔公式法相比)的特点和结论:①最大残差法只适用于方差是正态分布时的情形,要求样本数n≥2。②最大残差法的运算十分简便,一般只适用于小样本数(n≤10)时的情形。③当n≤6时,最大残差法优于修正前贝塞尔公式法。C n(MR) -ψ Bn
的最小值出现在n=3时,其最大值出现在n=46时,该值最终趋近于零。④当n=2和3时最大残差法等价于修正后贝塞尔公式法;当n≥4时,后者优于前者。C n(MR) -C n(B) 的最小值出现在n=2和3时,其最大值出现在n=46时,该值最终趋近于零。⑤当n=2和3时,修正后贝塞尔公式法和最大残差法的估计相对效率是100%;当n=4~10时,其相对效率不低于74.12%,随着n的增大,其相对效率急速下降(比极差法的下降速率还要快,与最大误差法的下降速率相当)且最终趋近于零。
发布评论