字数:4017 字号:大 中 小
摘 要:云模型是一种实现定性与定量之间的不确定性转换模型。基于云理论的考核成绩评价模型,根据全体考核对象的考核成绩,利用云模型客观反映这些成绩在多种概念下的分布,进而对成绩等级实现软划分,达到模糊分类的目的,为考核对象的成绩评价提供新的视角。文章把硕士研究生入学考试成绩作为研究对象,提出了一种新的研究生录取方式,进一步完善了当前研究生入学分数线的制定办法。实验结果表明,该成绩评价模型符合实际且更具有说服力。
关键词:云模型;云变换;成绩评价;分数线
0 引言
成绩评价不但是选拔人才的重要依据,有些部门还把它作为选拔人才的决定性依据,因此,制定出一种客观的成绩评价方法已成为一项重要的任务。目前,教育部门主要采用传统的方式对考核对象的成绩进行划分,根据某些规则制定分数线,进而对学生实现不同档次的硬划分,如英语四、六级考试的60分线、中考分数线、高考分数线等。用这种方式对学生进行分类,具有一定的弊端,如英语四级成绩,若某个学生的成绩为59分,与分数线只相差一分,却只能把他归到不及格一类。由于这些硬化的分数线其定性概念具有一定的不确定性,因此,利用定性与定量之间转化模型对成绩进行评价具有较好实用性,而且更贴近实际要求。
1 云模型相关理论
豆芽怎么发
设U是一个精确数值集合的定量论域,C是U上的定性概念。若定量值x∈U,且x是定性概念C的一次随机实现,x对C的隶属度(确定度)μc(x)∈[O,1]是具有稳定倾向的随机数,则x在论域U上的分布称为云,每个x称为一个云滴(x,μc(x))。
云是用语言值表示的某个概念与其定量表示之间的不确定性转换模型,用以反映自然语言中概念的不确定性。概念的整体特性用云的数字特征来反映,数字特征用三个参数来描述,分别为期望E真,熵En,超熵He,即(Ex,En,He)。期望Ex表示最能够代表定性概念的点;熵En表示定性既念的不确定性度量,反映了模糊性与随机性的关联性;超熵He是熵的不确定性度量,由模糊性和随机性共同决定。经统计分析,对于论域U中定性概念C有贡献的云滴主要落在区域田[Ex-3En,Ex+3En],贡献率为99.74%,因此这个区域以外的云滴对定性概念的贡献可以忽略。
云模型是云运算、云推理、云控制等方法的基础,同时也是本文提出的成绩评价模型的基础。由定性概念到定量表示的过程,称为正向云发生器;由定量表示到定性概念的过程,称为逆向云发生器。具体算法见文献。
四级总分多少 云变换是从某一属性的实际数据分布中抽取概念的过程,是从定量表示到定性描述的转换,是一个概念归纳的学习过程。其基本思想是,让高频率出现的数据值对定性既念的贡献大于低频率出现的数据值对定性概念的贡献,即将数据频率分布中的局部极大值点作为概念的中心——云模型的数学期望,它的峰值越高,表示数据汇聚越多,优先考虑其反映
的定性概念;然后在原分布中减去该定性概念的对应数值部分,再寻局部极大值;依次类推,最后根据已知的数据频率分布函数f(x),得到拟合误差函数f(x)及各个云模型的分布函数,计算出基于云模型的各个定性概念的3个特征值。某一实例的云变换过程如图1所示。
2 基于云理论的硕士研究生入学成绩评价模型
为了更清楚地说明基于云模型的成绩评价模型的优越性,我们把研究生入学考试总成绩作为研究对象,该模型的应用简化了研究生录取的程序。通常情况下,硕士研究生考试总成绩服从正态分布,因此,利用正态云描述录取资格和无录取资格概念具有一定的合理性。下面以2006年江西省30586个硕士研究生入学考试的成绩评价为例加以具体说明。图2所示为当年学生总分值在[0,500]中的频率分布。
有些学生虽然报考了研究生,但实际未参加考试或未能坚持考完四科,造成四门考试成绩
数据不完整,那么这些学生也就没有被录取资格,因此可以不考虑该区域内的数据,把低分区内的记录个数设为0。
厦门怪坡在哪里等距离区域法是数据挖掘中常用的连续数据离散化方法,它将论域[0,500]划分为多个宽度相等的子区域。这种方法中区域宽度和个数是主观给定的,都没有考虑实际的数据分布,也不能反映从实际连续数据中抽取定性概念的不确定性。为了解决这个问题,引入云变换的思想,可以实现连续数据离散化。经过云变换,得到相应的云模型,即无录取资格定性概念的数字特征为(250,30,0.3),录取资格定性概念的数字特征为(380,35,1),如图3所示。
从两个概念的云模型可知,录取资格的期望值为380分,而无录取资格的期望值为250分,两个云模型的相交点为320,且两个云模型有相交部分。此相交部分就是文章讨论的关键。对于录取资格云模型来说,考取380分的人数是最多的,故把它作为录取资格概念的期望值,而大于或小于380分的各分值人数则越来越少。同理,无资格录取云模型亦是如此。重叠部分称为模糊区域,意味着分数落入该区域的考生的录取资格是模糊的,究竟能否被录取要看这些学生所填的志愿、院校投档人数等相关因素。可以确定的是总成绩大
于大约320分的学生一定具有录取资格,小于大约280分的学生一定不具有录取资格。与传统方法比较,大于320分左右的学生相当于过了国家规定的分数线(2006年全国工科硕士研究生录取最低分数线为305分),而小于280分左右的学生相当于没过国家线,不具有被录取的可能,而分数落在模糊区域内的学生同时存在录取资格和无录取资格的可能性。事实上,该区域没有明显的边界,边界具有不确定性,这种模糊性软化了以往传统分数线的硬划分,从而摆脱了一分或半分决定命运的可能。
从上述分析可以知道,低分半模糊区域(小于280分左右)的学生已经被淘汰,没有被录取的资格;相反,对于高分半模糊区域的学生来说,相当于过了国家分数线,具有比较稳定的录取资格,对于院校来说,可以从这部分学生中来择优录取。若一些学校在这个高分半模糊区域内没有达到计划招收指标,则可以从两个地方来补充生源。一是从高分半模糊区域中接收调剂生;另外一个是模糊区域中招收学生,因为这个区域内的学生不被录取的可能性要大于高分半模糊区域。对于学生来说,分数越高,被录取的可能性就越大,因为高校录取原则是择优录取,因此,分数高的学生不会因为志愿问题而上不了好大学。分数处于模糊区域的学生,同样具有被录取的可能。或者有资格进入第一志愿院校复试;或者有资格调剂到别的院校,因为处于录取资格概念的范围。这就给了较低成绩的学生较大的机会。
在考场中发挥不正常其成绩落入模糊区域的学生,同样具有上好大学的机会,因为一些较好大学可能在高分半模糊区域未达到计划招收指标,不得不在模糊区域内招收学生。
基于云理论的成绩评价模型与传统的成绩评价一样,也可以发出通知,告之是否有资格进入复试。传统模型是以分数线来划分是否有资格进入复试,如2006年全国研究生入学考试最低分数线为305,国家教育部规定超过305分的学生有资格进入各个院校的复试。利用基于云理论的成绩评价模型也可以给出相似的规定。
(1)若成绩通知单显示为无录取资格,则该学生没有资格进入复试(没过国家线)。
(2)若成绩通知单显示为模糊录取资格,则该学生可能有资格也可能没资格进入复试,根据具体情况而定。
(3)若成绩通知单显示为录取资格,则该学生有资格进入复试(相当于过国家线)。
李念哥哥 这样,成绩单不再是定量的分数,而是以定性的概念来反映该学生的成绩。当然各院校招生时,需要把定性概念与定量数据相结合。通过频率分布函数,容易得到以上三种规则分别容纳(其中为模糊边界,不是一个确定值),这有利于成绩的统计分析,为各部门招生带
来便利。
3 结束语
基于云理论的成绩评价模型利用了李德毅教授提出的云模型,实现了概念的不确定性表示。它让人们从直观的概念去理解成绩,摆脱了以往“一刀切”现象的发生。该模型不仅可用于研究生入学考试成绩评价,还可以应用于其它方面的考核评价,如研究生复试成绩评价、英语四级和六级成绩评价、高考成绩评价、教学质量评价等。该成绩评价模型具有可理解性强、实用性广、易被人接受等特点。需要说明的是基于所研究数据的连续性和数据间的相互关系,在处理云变换过程中,产生的云模型不一定是正态云,可能是半云模型、组合云模型等。对于不同类型的云模型,要用不同的方法来处理,但基本方法还是相同的。
>尹灿荣
发布评论