总体:根据研究目的确定的研究对象的全体
个体:总体中的一个研究单位
样本:实际研究中的一类假象总体
样本含量:样本中所包含的个体数目称为样本含量或大小
随机样本:一类从总体中随机抽得到的具有代表性的样本
统计量:由样本计算的特征数
参数:由总体计算的特征数
精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度
系统误差系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。
偶然误差一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。
连续性变数资料:指用量测方式获得的数量性状资料
离散型变数资料:指用计数方式获得的数量性状资料
算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数
平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数
标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)
离均差平方和:样本各观测值变异程度大小的另一个统计数
试验:在一定条件下对自然现象所进行的观察或试验统称为试验
随机事件:随机试验的每一种可能结果
概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率
正态分布:若连续性随机变量X的概率分布密度函数X服从正态分布
标准正态分布:我们把平均数u=0,σ2 1时,称为标准正态分布,记为N01
双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率
单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率
标准误:反映样本平均数的抽样误差的大小的一种指标
假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
t检验两总体方差未知但相同,用以两平均数之间差异显著性的检验。
无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。
备择假设:是在无效假设被否定时准备接受的假设。
显著水平:用来确定无效假设是否被否定的概率标准。
Ⅰ型错误:把非真实差异错判为真实差异。
Ⅱ型错误:把真实差异错判为非真实差异。
双侧检验(双尾检验):利用两侧尾部的概率进行的检验。
单侧检验(单尾检验):利用一侧尾部的概率进行的检验。
分位数 又称百分位点。若概率0<p<1,随机变量 X或它的概率分布的分位数Za明道资料。是指满足条件p(X>Za)=α实数
配对设计:是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。
区间估计:是指在一定概率保证下指出总体参数的可能范围。
置信区间:是指在进行区间估计时所给出的可能范围。
置信度(置信概率):是指在进行区间估计时所给出的概率保证。
方差分析:实质上是关于观测值变异原因的数量分析。
试验指标:用来衡量试验结果的好坏或处理效应的高低,在试验中具有测定的性状或观测的项目。
试验因素:实验中所研究的影响试验指标的因素。
因素水平:试验因素所处的某种特定状态或数量等级。
试验处理:率先设计好的实施在试验单位上的具体项目。
试验单位:在试验中能够接受不同试验处理的独立的试验载体。
多重比较:统计学上指多个平均数两两之间的相互比较称为多重比较。
主效应:由于因素水平的改变而引起试验指标观测值平均数的改变量称为主效应。
简单效应:在某因素同一水平上,另一因素不同水平试验指标观测值之差称为简单效应。
适合性检验 :判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验。
相关变量:存在相关关系的变量叫做相关变量。
回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
相关分析研究随机变量之间相关性的统计分析方法。
直线回归分析:如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为直线回归分析
直线相关分析:对两个相关变量间的直线关系进行相关分析称为直线相关分析
相关系数 :统计学上把决定系数r2的平方根称为xy的相关系数
试验设计:以概率论和数理统计为理论基础,经济地,科学地安排试验的一项技术。
随机 使用随机方法对试验动物分组,使参试动物分入各试验处理组的机会相等,以避免试验动物分组事试验人员主观倾向的影响
重复:试验的每一个处理都实施在两个或两个以上的试验单位上
二、填空
1、生物统计分描述性统计和分析性统计。描述性统计是指运用分类、制表、图形以及计算概括性数据(平均数、标准差等)来描述数据特征的各项活动。分析性统计是进行数据观察数据分析以及从中得出统计推断的各项活动。
2、统计分析的基本过程就是由样本推断总体的过程。该样本是该总体的一部分。
3、由样本获取总体的过程叫抽样。常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、抽样等。
4、样本平均数与总体平均数的差异叫抽样误差。常用 S/N表示。
5、只有降低抽样误差才能提高试验结果的确性。试验结果的确性包括确性和确性。
6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。系统误差(条件误差)影响试验结果的确性,随机误差(偶然误差)影响试验结果的确性。
7系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。随机误差(偶然误差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。
8、样本推断总体分假设检验和区间估计两大内容。常用的检验方法有t检验F检验卡方检验
9、置信区间指在一定概率保证下总体平均数的可能范围。
10t检验是通过样本平均数差值的大小来检验处理效应是否存在,两样本平均数的差值代
表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。此法先建立无效假设:即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率(即可能性大小的衡量)来判断无效假设是否成立。
11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为α
12t检验通常适合样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用t检验。
13F检验也叫方差分析。通常适合三个或三个以上样本连续性(非间断性)随机变量资料的假设检验。顾名思义,F检验是用方差的变异规律(即F分布)来检验处理效应是否存在。
14F检验是从总离均差平方和自由度的剖分开始,将总变异剖分为组间变异和组内变异。因为组间变异由处理效应和误差效应共同引起,组内变异由误差效应引起。因而,将计算出的组间方差和组内方差进行比较,就可判断处理效应是否存在。
15F检验显著或极显著说明组间处理效应存在,但并不能说明每两组间都存在差异,要知道每两组间是否有差异,必须进行多重比较,常采用的比较方法有最小显著差数法(LSD法)最小显著极差法(LSR法),后一种方法又分为q法和新复极差法(SSR法)。生物试验中常采用新复极差法(SSR法)。
16、两因素无重复观测值方差分析只能分析试验因素的简单效应和效应,不能分析出互作效应,因此时计算的误差自由度为0。当两因素有互作效应时,试验设计一定要在处理组(水平组合)内设立重复
17、两因素有重复观察值方差分析,既可分析出两因素的效应,还可分析出互作效应。当互作效应显著存在时,可通过多重比较出最佳水平组合
1835、多重比较的结果通常用字母表示,平均数右上角具有相同英文字母表示差异不显著,具有不同英文字母表示差异显著。用小写英文字母表示差异显著,用大写英文字母表示差异极显著
19、当二项分布接近于正态分布时,两次数资料样本的差异,可通过计算百分数,用t检验。
20、次数资料也可用检验法进行假设检验,检验可分为适合性检验和独立性检验。
21、独立性检验要先设计出联列表,然后用检验,检验两因子是相互独立还是相互依赖,即两因子有无相关性。
22分布是随自由度变化的一簇曲线,任一曲线皆是连续的。在次数资料的显著性检验中,当检验资料的自由度等于1时,算得的值将有所偏大,因此应予以矫正,统计上称为连续性矫正
23独立性检验中,当某一单元格所计算的理论次数在5以下时,要进行相近单元格合并处理。
24三种统计分析能得出两试验因素有无相关性的结论,它们是:两因素有重复观测值方差分析,通过互作效应检验说明、独立性检验相关回归分析
25、假设检验差异显著或极显著,通常用“*”或“**”表示,说明:95%99%的把握说明处理效应存在,但要犯5%1%Ⅰ型错误,即有5%1%的可能将处理效应不存在判定为存在,或将非真实效应判定为真实效应。
26、假设检验差异不显著说明试验结果有两种可能:一是真实效应的确不存在,二是由于犯Ⅱ型错误真实性差异判定为非真实性差异,其可能性大小受显著水平α样本平均数之间的差异、试验误差的大小有关。
27、假设检验的两个类型错误相互制约,处理好它们之间的矛盾的措施是加大样本含量降低试验误差
28、试验误差既影响样本观测值的准确性,又影响假设检验的可靠性,因而试验之前应采用合理的方法设计试验尽量减少或降低试验误差。试验设计的基本原理是随机重复局部条件一致
29、常采用的试验设计方法有:完全随机试验设计配对或随机单位组设计拉丁方设计交叉设计正交试验设计
30、完全随机试验设计只用随机重复两个原理,适合样本变异不大时应用。配对或随机单位组设计应用了试验设计的随机重复局部条件一致三个原理,可以降低试验误差,当样本变异较大时应用。但组对和组单位组要求严格,不能勉强组对和组单位组。
31、正交试验设计适合因子水平试验设计。
32、试验计划的核心内容是试验方案、试验方法样本含量的确定。
33、试验方案中各因素水平的设置常采用等差等比随机法确定。
34、多个处理(处理数为三或三以上时)比较试验中,各处理的重复数按误差自由度为12以上的原则来估计,因这以后临界F值减小的幅度已很小。