总体:根据研究目的确定的研究对象的全体
个体:总体中的一个研究单位
样本:实际研究中的一类假象总体
样本含量:样本中所包含的个体数目称为样本含量或大小
随机样本:一类从总体中随机抽得到的具有代表性的样本
统计量:由样本计算的特征数
参数:由总体计算的特征数
精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度
系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。
偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。
连续性变数资料:指用量测方式获得的数量性状资料
离散型变数资料:指用计数方式获得的数量性状资料
算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数
平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数
标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。
离均差平方和:样本各观测值变异程度大小的另一个统计数
试验:在一定条件下对自然现象所进行的观察或试验统称为试验
随机事件:随机试验的每一种可能结果
概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率
小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理
正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布
标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1)
双侧概率明道资料:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+kσ)之外,取值的概率称为双侧概率
单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率
二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布
标准误:反映样本平均数的抽样误差的大小的一种指标
t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t分布。
t检验:两总体方差未知但相同,用以两平均数之间差异显著性的检验。
无效假设:被检验的假设,通过检验可能被否定,也可能未被否定。
备择假设:是在无效假设被否定时准备接受的假设。
显著水平:用来确定无效假设是否被否定的概率标准。
Ⅰ型错误:把非真实差异错判为真实差异。
Ⅱ型错误:把真实差异错判为非真实差异。
双侧检验(双尾检验):利用两侧尾部的概率进行的检验。
单侧检验(单尾检验):利用一侧尾部的概率进行的检验。
否定区:
接受区:
分位数: 又称百分位点。若概率0<p<1,随机变量 X或它的概率分布的分位数Za。是指满足条件p(X>Za)=α的实数
配对设计:是指先根据配对的要求将试验单位两两配对,然后将配对成子的两个实验单位随机分配到两个处理组中。
区间估计:是指在一定概率保证下指出总体参数的可能范围。
置信区间:是指在进行区间估计时所给出的可能范围。
置信度(置信概率):是指在进行区间估计时所给出的概率保证。
方差分析:实质上是关于观测值变异原因的数量分析。
试验指标:用来衡量试验结果的好坏或处理效应的高低,在试验中具有测定的性状或观测的项目。
试验因素:实验中所研究的影响试验指标的因素。
因素水平:试验因素所处的某种特定状态或数量等级。
试验处理:率先设计好的实施在试验单位上的具体项目。
试验单位:在试验中能够接受不同试验处理的独立的试验载体。
多重比较:统计学上指多个平均数两两之间的相互比较称为多重比较。
主效应:由于因素水平的改变而引起试验指标观测值平均数的改变量称为主效应。
简单效应:在某因素同一水平上,另一因素不同水平试验指标观测值之差称为简单效应。
交互作用:在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上的简单效应不同。
适合性检验 :判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验。
相关变量:存在相关关系的变量叫做相关变量。
回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。
相关分析:研究随机变量之间相关性的统计分析方法。
直线回归分析:如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为直线回归分析
直线相关分析:对两个相关变量间的直线关系进行相关分析称为直线相关分析
决定系数:在Y的总平方和中,由X引起的平方和所占的比例,记为r2(r的平方)
相关系数 :统计学上把决定系数r2的平方根称为x与y的相关系数
试验设计:以概率论和数理统计为理论基础,经济地,科学地安排试验的一项技术。
试验方案:叙述试验的背景、理论基础和目的,试验设计、方法和组织,包括统计学考虑、试验执行和完成的条件。方案必须由参加试验的主要研究者、研究机构和申办者签章并注明日期。
唯一差异原则:指除了试验处理不同外,其他所有条件应相同,以保证试验处理具有可比性
随机 :使用随机方法对试验动物分组,使参试动物分入各试验处理组的机会相等,以避免
试验动物分组事试验人员主观倾向的影响
重复:试验的每一个处理都实施在两个或两个以上的试验单位上
局部条件一致原则 :在试验环境或试验差异较大的情况下,将试验环境或试验单位分成若干个小组,在小组内是非处理因素尽可能一致,实现试验条件的局部一致性
完全随机设计:根据试验处理将全部试验动物随机分成若干组,然后再按组实施不同处理
的设计
随机单位组设计:同一单位组内各头试验动物的初始条件尽可能一致,不同单位组间试验动物的初始条件允许有差异
拉丁方设计:从横行和直列两个方向进行局部控制,比随机单位组设计多一个单位租的设计
二、填空
1、生物统计分描述性统计和分析性统计。描述性统计是指运用分类、制表、图形以及计算概括性数据(平均数、标准差等)来描述数据特征的各项活动。分析性统计是进行数据观察、数据分析以及从中得出统计推断的各项活动。
2、统计分析的基本过程就是由样本推断总体的过程。该样本是该总体的一部分。
3、由样本获取总体的过程叫抽样。常用的抽样方法有随机抽样、顺序抽样、分等按比例抽样、整抽样等。
4、样本平均数与总体平均数的差异叫抽样误差。常用 S/√N表示。
5、只有降低抽样误差才能提高试验结果的正确性。试验结果的正确性包括准确性和精确性。
6、试验误差按来源分为系统误差(条件误差)和随机误差(偶然误差)。系统误差(条件误差)影响试验结果的准确性,随机误差(偶然误差)影响试验结果的精确性。
7、系统误差(条件误差)可以控制,可通过合理的试验设计方法降低或消除。随机误差(偶然误差)不可控制,可通过理论分布来研究其变异规律,或相对比较其出现的概率的大小。
8、样本推断总体分假设检验和区间估计两大内容。常用的检验方法有t检验、F检验和卡方检验。
9、置信区间指在一定概率保证下总体平均数的可能范围。
10、t检验是通过样本平均数差值的大小来检验处理效应是否存在,两样本平均数的差值代
表了试验的表观效应,它可能由处理效应(真实效应)和误差效应引起,要检验处理效应是否存在,常采用反证法。此法先建立无效假设:即假设处理效应不存在,样本平均数差值是由误差引起,根据差异在误差分布里出现的概率(即可能性大小的衡量)来判断无效假设是否成立。
11、判断无效假设是否成立的依据是小概率事件实际不可能原理,即假设检验的基本依据。用来肯定和否定无效假设的小概率,我们称之为显著水平,通常记为α 。
12、t检验通常适合两样本连续性(非间断性)随机变量资料的假设检验,当二项分布逼近正态分布时,百分数资料也可用t检验。
13、F检验也叫方差分析。通常适合三个或三个以上样本连续性(非间断性)随机变量资料的假设检验。顾名思义,F检验是用方差的变异规律(即F分布)来检验处理效应是否存在。
14、F检验是从总离均差平方和与自由度的剖分开始,将总变异剖分为组间变异和组内变异。因为组间变异由处理效应和误差效应共同引起,组内变异由误差效应引起。因而,将计算出的组间方差和组内方差进行比较,就可判断处理效应是否存在。
15、F检验显著或极显著说明组间处理效应存在,但并不能说明每两组间都存在差异,要知道每两组间是否有差异,必须进行多重比较,常采用的比较方法有最小显著差数法(LSD法)和最小显著极差法(LSR法),后一种方法又分为q法和新复极差法(SSR法)。生物试验中常采用新复极差法(SSR法)。
16、两因素无重复观测值方差分析只能分析试验因素的简单效应和主效应,不能分析出互作效应,因此时计算的误差自由度为0。当两因素有互作效应时,试验设计一定要在处理组(水平组合)内设立重复。
17、两因素有重复观察值方差分析,既可分析出两因素的主效应,还可分析出互作效应。当互作效应显著存在时,可通过多重比较出最佳水平组合。
18、35、多重比较的结果通常用字母表示,平均数右上角具有相同英文字母表示差异不显著,具有不同英文字母表示差异显著。用小写英文字母表示差异显著,用大写英文字母表示差异极显著。
19、当二项分布接近于正态分布时,两次数资料样本的差异,可通过计算百分数,用t检验。
20、次数资料也可用检验法进行假设检验,检验可分为适合性检验和独立性检验。
21、独立性检验要先设计出联列表,然后用检验,检验两因子是相互独立还是相互依赖,即两因子有无相关性。
22、分布是随自由度变化的一簇曲线,任一曲线皆是连续的。在次数资料的显著性检验中,当检验资料的自由度等于1时,算得的值将有所偏大,因此应予以矫正,统计上称为连续性矫正。
发布评论