统计师测试辅导:分配数列的编制
分配数列的编制 1.种类 ①属性分配数列: 按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。 ②变量分配数列 按数量标志分组而形成的数列叫变量分配数列,简称变量数列。 1)单项式变量分组数列 是按每个变量值分别列组而形成的数列。 2)组距式变量数列 把各变量值按照一定组距进行分组而形成的数列。如:上例某班学生统计考试成绩表。 在组距数列中,表示各组界限的变量值称为组限,50—60,60—70等。其中较小的变量值称为下限,50,编制考试60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距,组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。 a.等距分组 各组的组距均相等。 特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。 次数密度=次数/组距,其作用主要用于消除各组组距不相等而造成的现象分布的影响。 b.不等距分组 各组组距不相等。 特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少, 因此必须消除组距对其分布的影响即需计算次数密度。 在编制组距式
变量数列时,常常会遇到这样的情况,如:学生成绩的分布 60分以下 60—70 70—80等 又如:学生人数的分布 30人以下 30—60 60人以上等 这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算? 下开口的组中值=上限-1/2邻组组距 上开口的组中值=下限+下限1/2邻组组距 2.变量数列的编制 程序:①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列) a.离散型变量 由于离散型变量各变量值之间以整数断开,变量值之间有明显的界限,上下限都可以用准确的数值表示,组限非常清楚。 如:某校按学生人数分组,其组限为: 100人以下 101—200 201—300 301—400 401人以上 b.连续型变量 由于连续型变量各变量值之间可做无限分割,有小数存在,上下限不能用两个确定的值表示,只能用前一组的上限与本组的下限为同一数值表示。如:上例考试成绩 统计实际工作中,虽然变量区分连续型变量与离散型变量,但为了计算,绘图等的方便,保证整体单位不出现重复、遗漏。可采用连续型变量的形式代替离散型变量。 对于连续型变量,在确定组,有一原则可循,即“上组限不在内”原则:各组只包括本组下限变量值的单位,不包括本组上限变量值的单位。 3.编制统计表 如上例40人考试成绩分为5组,组距为10,组限可以为: 50—60,60—70,…,90—100 可以使考试成绩的优、良、中、及、不及格的特征体现出来
发布评论