2019年6月
第19卷第2期
廊坊师范学院学报(自然科学版)
Journal of Langfang Normal University(Natural Science Edition)
Jun.2019
Vol.19No.2
方差分析多重比较中?值表和SSR表的构建
李俊,丁建华*,金显文,张兴旺,吴晓敏
(淮北师范大学,安徽淮北235000)
【摘要】SNK法和Duncan法是方差分析中最常用的两种多重比较方法,在检验过程中需要分别查询g值表和SS/?值表。这两种表格在多数统计学教材或专著中都有收录,以供读者查阅。但是,这些教材均没有说明g值和SSR值的基本原理。为此,对SNK法和Duncan法多重比较方法的原理进行详细叙述,并利用Exce
【关键词】多重比较;SNK法;Duncan法;g值表;SSR值表
Constructing the q Value Table and SSR Value Table in Multiple
Comparisons of Variance Analysis
LI Jun,DING Jian-hua,JIN Xian-wen,ZHANG Xing-wang,WU Xiao-min
(Huaibei Normal University,Huaibei235000,China)
[Abstract]Both the SNK(Student-N e wman-Keuls)test and Duncan's test are the commonest methods of multiple comparisons in variance analysis,which need to use q value table and SSR value table respectively.These two tables are included in most statistical textbooks or monographs for readers to consult.However,these textbooks do not explain how the q critical values and the SSR critical values are generated.In this paper,the principle of two multiple comparison methods,SNK test and Duncan s s test,is described in detail,and the function of Excel is used to realize the automatic generation of the q critical value table and SSR critical value table,thus avoiding the trouble of consulting the tables.
[Key words]multiple comparisons;Student-Newman-Keuls test;Duncan's test;q value table;SSR value table
〔中图分类号〕0212.1〔文献标识码〕A〔文章编号〕1674-3229(20⑼02-0064-04
0引言
当方差分析的结果表明某因素的多个水平间差异达到显著或极显著程度时,还需要进一步的多重比较,以具体说明到底是哪两个水平间有着显著或极显著差异。多重比较的方法有很多,其中最常用的有最小显著差数法(the least significant difference method,LSD)和最小显著极差法(the least significant range method,LSR)[110LSR法是在一定的显著水平a上,根据极差范围内所包含的处理数据£(亦称为秩次距)的不同而采用不同的显著差数标准进行比较。该方法又分为SNK法(Student-Newman-Keuls test)和Duncan法(Duncan's test),需要分别查询g值表和SSR值表,它们均以统计量g分布为基础。由于g分布的概率密度函数公式复杂⑵,手动计算难度较大,所以在多数统计学教材或专著中并没有给出其概率密度函数公式,也就无从说明g值是如何生成的,它们只收录了统计量g在特定条件下的已知数值表供读者查询。周诗国曾利用统计软件SAS中的PROBMC函数来生成q临界值,从而克服了查g值表的不便叫但是,SAS的普及程度毕竟有限,而Excel作为一种最为常见的办公软件,
[收稿日期]2018-10-18
[基金项目]安徽省省级质量工程项目(2018jyxm0516,2018zhkt027,2017mooc323);淮北师范大学校级质量工程项目(2017kfkcl52,jy2017124,JY18001,JY18016,JY18036)
[作者简介]李俊(1978-),男,博士,准北师范大学生命科学学院讲师,研究方向:分子遗传学。
[通讯作者]丁建华(1979-),男,博士,淮北师范大学生命科学学院副教授,研究方向:动物分类与系统学。
•64•
第19卷•第2期丁建华等:^重够中加和ssR飾sum2019年6月
具有强大的函数运算能力,近年来在统计学教学过程中得到广泛应用4%本文以Excel2010为例来
说明g值表、SS2?值表的生成过程,以供参考。
1SNK法
1.1原理
该检验法又称为q检验法,它以统计量q的概率分布为基础。统计量®又被称为学生化极差
(studentized range)统计量,它假定从M个正态总体(具相同的平均数“和相同的方差/)中以大小为
n分别进行抽样时,这M个样本平均数中最大的平均数为也,最小的为為,亡为这M个样本的合并方差侧:
该统计量的分布形状随的变化而变化(4T=M(n-l))[2]o当该统计量用于SNK法多重比较时,先计算出达到差异显著的最小差数,记作陋,即:
式中,£为方差分析中误差项方差,也就是各水平中随机误差的合并方差*为各水平的重复数,若各水平的重复数不相等,则以加权重复数股代替,即:
吩(410,
细验)为秩次距纵方差分析中误差项自由度硯以及显著水平a条件下的9值⑴。所谓秩次距比
(ordinal distance k),是指所比较的两个经排序后的均数之间的跨度,即将平均值按从大到小进行排序后,假定某两个平均数的序号分别为口和弓,则这
两个平均数间的秩次距社”-"+1叫在求得不同秩次距条件下的LSR a之后,用两个处理平均数的差值与之相比较,若肉-元2〔>⑹a,即为在给定
的a水平上差异显著;反之,则差异不显著。SNK 法不仅可以比较出是哪两个水平有显著差异,还可以对差异显著的水平进行分组,得到相似子集。
1.2@值表的构建
在各种版本的Excel软件中,有许多关于概率分布的函数,比如TINV、CHIINV、FINV等函数可以生成一定概率与自由度下相应的『值、分值和F值, 但是却没有彳分布函数。笔者在浏览我国一些主要的统计学论坛时,也经常能看见有些网友发帖咨询Excel中有关?值函数的问题。Real Statistics Using Excel是Zaiontz博士为致力于使用Excel进行统计分析而建立的公益性网站⑼,他开发的资源包中就含有g分布函数(QCRIT和QINV),可以用来构建®值表,其步骤如下。
第1步:下载资源包0在该网站(-al-statistics/)的Free Download目录下Resource Pack页面,有适合Excel各种版本的资源包供免费下载,比如2003、2007、2010、2013等等,选择一款与自己所用的Excel版本相一致的资源包下载保存。虽然资源包的存放位置不会影响到最终的安装和运行,但由于一经安装后不能再改变其位置,故建议将资源包存放在C:盘的合适位置。本文下载的是2010版本,文件名为"RealStats-2010.xlam"o 第2步:资源包的安装。新建一个Excel文件,按“Alt+T+I”这3个键进入加载宏对话框(图1),勾选其中的“规划求解加载项”(若是英文版,则是Solver Add-in)—►确定。再点击"文件"―►"帮助/选项”-“加载项”点击“浏览(B)…”,选定刚才在C盘存放的资源包RealStats-2010.xlam后确定即可。
图1加载宏对话框
第3步:®值表的构建。QCRIT(A;,#,a,tails, h)函数中北为秩次距;亦为自由度;咖取值为1或2,分别表示单尾或双尾,默认值为2必取值为true 或false,true表示使用调和插值,false表示使用线性插值,默认值为true。以显著性水平a=0.05时为例(图2),在A1中输入0.05,在A列中自A3开始输入
•65
-
2019年6月廊坊师范学院学报(自然科学版)第19卷•第2期
“1、2、3…”表示自由度,在第2行中自B2开始输入 “2、3、4…”表示秩次距,在B3单元格中输入“=
QCRIT ( B$2,$A3,$A$1)”,将此函数向下、向右填
充,一张0.05显著水平下的双尾q 值表便生成了 o 若想生成0.01显著水平下的双尾g 值表,只要将A1
中的0.05修改为0.01即可。另外,QINV(p,烈筋 叙汤)函数也可以用来生成指定概率P 、秩次距k 和 自由度时条件下的g 值。
图2构建@值表的输入示例
B3…
b =qcrit(B?2,<4A
B C 0
E F G
H 1 J
1
0.05
k Ctt 次距〉2
df 234S 678910
I 17.9726.9&32.8237.0S 40.4143.1245.447.3649.074
I
6.08583319.79810.8811.7312.4413.0313.5413.995
34,5015・91 6.8257,5028.0378.4788.8529.1779.4^2
64 3.926 5.04 5.757 6.287 6.7067.OS37.3477.6027.826
7
5
3.635
4.602
5.218
5.673
6.0336.幻
6.582 6.801
6.995
2 Duncan 法
2.1原理
该方法又称为新复极差法(new multiple range
test)或 SSR 法(the shortest significant range method),
它的比较过程与SNK 法极为相似,其区别仅在于计 算最小显著极差心时不是查q a 值,而是查SSR a
值,即:
彌皿),
LSR 。
式中,£和n 的含义同SNK 法中一致,
SSR 叭Q 为秩次距匕方差分析中误差项自由度就 以及显著水平a 条件下的SSR 值。该方法由Dun
can D.B.于1955年在SNK 检验法的基础上改进而来,所用到的统计量仍然为®统计量,它的原理是这
样的问:假如两平均数间比较的显著水平确定为
a 侧其犯I 型错误的最大概率为a 、确保不犯[型错 误的保护水平为l-«o 对于上个平均值间的比较
来说,其无效假设丑Q 为均=“2二…二以,这其中包 含比-1个两平均数间的比较,即“严血、
“2二“3、…、代-1二爆。由于这氏-1个两平均数间
的比较是相互独立的,于是,确保不犯I 型错误的保 护水平便变为(1-a/-1,该水平被定义为“基于自
由度的保护水平(protection levels based on degrees
of freedom)"。相应地,其显著性水平不再是a ,而
是被调整为1 -(1 -旷,因而就有以下公式:
当肛2时,SSR 犧瞅①=9(k,df,y);
当診3时,S 朋佑如)=拠必綿如,SSR 皆、灣"
式中,尸1-(1-0)1。该式表明:当龄3时,
SS%如取细如和SSR,—歸这两者当中较大 的那个,这样做的目的是为了确保任何两个平均数
之间的比较,其保护水平均为(l-a)'-1 o
从以上论述可以看出SNK 法与Duncan 法的异 同,其相同之处在于均是建立在统计量9分布的基 础之上的多重比较方法;其不同之处在于,对于秩
次距为k 的任何两个平均数间的比较来说,SNK 法 的显著水平均为a ,而Duncan 法的显著水平为
l-Cl-a/^o 于是,当上> 3时,Duncan 法犯I 型错 误的概率要高于SNK 法。
2.2 SSR 值表的构建
根据上述SSR 值公式,以显著性水平a =0.05时
为例(图3),在B3 中输入“二QINV ((1-(1-$A$1 )" (B$2-1 )), B$2 , $A3 )”,并将此函数向下填充, 再在C3 中输入a =MAX (B3,QINV((l-(l- $A$1 Y
(C$2-1)), C$2 , $A3 ))”,并将此函数向下、向右 填充,一张0.05显著水平下的双尾SSR 值表便生成
淮北师范大学是一本还是二本To 若是想生成0.01显著水平下的双尾SSR 值表, 也只需要将A1中的0.05修改为0.01即可。
C3 ▼ © & m
£A
B
C
D E &G H i 1
10.05k (秩次览〉2df
23
4567g 9
101
17.9717.9717.9717.9717.9717.9717.9717.9717.9742 6.0826s082 6.082 6.082S.082 6.0826082 6.08260825
3 4.501 4.516 4.51& 4.516 4.516 4.516 4.51& 4.S16 4.5166
4 3.926
4.013 4.033
4.033 4.033 4.033
4.033
4.033
4.033
7
S
3.635
3.749
3.796
3.814
3.814 3.814
3.814
3.814
3.814
图3构建SSR 值表的输入示例
3讨论
尽管多数的统计学教材或专著中都收录有?值 表或SSR 值表,但这些表格均存在以下不足之处:①
由于篇幅限制,均只收录了 0.05和0.01这两个显著 水平所对应的临界值,且包含的氐和帝也相当有限, 在许多情况下需要用内插法进行求解;②不同的统
计学书上g 临界值和SSR 临界值有大小不一致的现 象,而且这些表格中的数字通常为手动输入,因此
常常存在输入错误;③使用时需要査表,但有关统
计学书并不总是触手可及o 通过Real Statistics Re source Pack software 中的QCRIT 或QINV 函数进行 自动生成则有效地克服了 3个不足之处,且这个资
源包一经安装便长期有效,给教师的教学与学生的
• 66 ■
第19卷•第2期丁建华等:方差分析多重比较中g值表和SSR值表的构建2019年6月
学习都带来很多方便。
本文虽然只叙述了g值表和SSR值表的生成过程,但是,多重比较中的Turkey's HSD法和REGWQ 法所用的g临界值也可以一并生成,因为它们都是基于q分布的两两比较。在借助QCRIT(A:,df,a,tails, h)函数计算q临界值时,由于该函数是基于当前存在的q值表所编写的程序,故当a>0.1或£与/中至少有一个取值过大时,其返回值为缺失值;而QINV(p, A;,#,tails)®数中p、£与冷的取值范围要比QCRIT函数中相应部分要宽,但其运算速度较慢。不过,实际工作中几乎不会有多重比较的丘和分超过此两个函数的情况,因此,用这两个函数来计算g值,完全能够满足实际的需要。建议首选QCRIT函数,当QCRIT 函数解决不了时,再尝试用QINV函数。在求SS2?值时,由于QINV函数运算较慢,所以在实际应用时无需生成整张表格,只需要修改A3单元格中的数字,便可求得相应自由度下的SSR值。
[参考文献]
[1]李春喜,姜丽娜,邵云,等.生物统计学(第五版)[M].
北京:科学出版社,2013.
[2]Laurencelle L.,Dupuis F.—A.Statistical tables,explained
and applied[M].Singapore:World Scientific Publishing
Co.Pte.Ltd.,2002:65-71.
[3]周诗国,胡良平.q临界值W值和入值的含义及其计算[J].
中国卫生统计,2012,29(1):27-30.
[4]Warner C.B.,Meehan A.M.Microsoft Excel™as a tool for
teaching basic statistics[j].Teaching of Psychology, 2001,28(4):295-298.
[5]Nash J.C.Teaching statistics with Excel2007and other
spreadsheets[j].Computational Statistics and Data Analysis,2008,52(10):4602-4606.
[6]盛晓兰.正态总体均值的假设检验及其在Excel中的实
现[J].廊坊师范学院学报(自然科学版),2009,9(6): 33-34,38.
[7]Ding J.H.,Jin X.W.,Shuai L.Y.Understanding the degrees
of freedom of sample variance by using Microsoft Excel[j].
Teaching Statistics,2017,39(5):92-95.
[8]Ding J.H.,Shuai L.Y.,Xue J.B.,et al.Application of Mi
crosoft Excel in understanding the degrees of freedom of linear regression[j].Journal of Statistics:Advances in Theory and Applications,2018,19(1):17-30.
[9]Zaiontz C.Real Statistics Using al-statistics,
com,2018.
[10]Duncan C B.Multiple range and multiple F-tests[j].Bio
metrics,1955,11(1):1-42.
(上接第63页)
较对照组提高了55.7%;不同浓度Ca“试验组与对照组间差异不显著。
3讨论
不同酶的酶活性中心由不同金属离子构成,金属离子种类及其含量宜接影响酶的活性。这种作用一方面与酶活性中心的构成有关,另一方面与酶解过程中酶与底物的相互作用有关。本试验中Fe“、MQ对壳聚糖酶生产及活性具有明显的促进作用,且随离子浓度变化而变化。其原因有待进一步对壳聚糖酶分子结构组成及其作用模型进行研究,以便揭示其作用机制。
单纯的Ca“对壳聚糖酶的酶比活力没有显著影响,但高浓度Ca"对于壳聚糖酶的生产却表现出极大的抑制作用。综合分析其原因在于,高浓度Ca“对壳聚糖酶产生菌株Yg的生长代谢产生了显著影响,具体影响途径及机制有待进一步研究。4结论
无论是对壳聚糖酶生产还是壳聚糖酶活性,不同种类及浓度的金属离子表现出明显的影响作用。Fe”、Mg"对壳聚糖酶生产及活性具有明显的促进作用,而高浓度C0对于壳聚糖酶的生产表现出显著的抑制作用。
[参考文献]
[1]刘志友,闫素梅,郭晓宇.壳聚糖及其衍生物对动物脂质
代谢的调节作用及其机制[J].动物营养学报,2018,(6):2042-2049.
⑵韩玉娟,王华,路新枝.壳聚糖酶的研究进展[J]冲国海洋
药物,2018,(2):88-96.
[3]戴大章,夏黎明,方祥年.壳聚糖的酶法降解[J]•功能高分
子学报,2005,(4):687-691.
[4]袁建平,侯晓强.壳聚糖酶的分离纯化及性质研究[J].食
晶科技,2013,(9):165-167.
⑸袁建平,侯晓强.固定化技术在壳聚糖酶生产中的应用[J].
湖北农业科学,2013,52(21):5282-5284.
•67•
发布评论