基于多维度增值评价的学校高考质量评价体系研究
作者: 景雪峰 郝雅琪 雷杰【摘要】随着基础教育改革的推进,教育评价改革也迫在眉睫。借助大数据处理,创建科学的、能促进高中教育质量提升的高考质量评价体系是引领教学改革方向的重要手段。文章基于多维度增值评价的学校高考质量评价体系在平均分和本科上线率两个指标的基础上,增加了基于标准分的增值和基于等级百分比的增值两个指标,从四个维度评价学校的高考质量,解决了以往评价体系中各校因入口成绩不同而发展空间各异的问题,较为客观公正的进行评价,并提供各校促进高中教育质量提升所需的数据支撑。
【关键词】高考;增值评价;多维度;标准分;平均分
【中图分类号】G632.475【文献标志码】A【文章编号】1004—0463(2022)16—0029—04
高考质量评价体系,作为中国基础教育质量监测评价体系的一项内容,是为了促进高中教育质量的提升,其结构张力表现为技术与行政的张力,即做好数据技术处理的同时要兼顾教育行政的要求。教育行政部门、教学研究部门、社会都高度重视一个区域内不同学校教育质量的评价,尤其是对各校高考成绩的评价。长期以来,这种评价是基于评价者的教学经验,缺乏科学实证和数据支撑。随着以证据为本的科学决策的逐步深入,以及我国义务教育质量检测的逐步推进,对学校教育质量的评价方法也在逐步转变,其价值取向与结构张力也越来越清晰。
2020年6月30日,中央全面深化改革委员会第十四次会议审议通过了《深化新时代教育评价改革总体方案》,其明确提出:“改进结果评价,强化过程评价,探索增值评价,健全综合评价,着力破除唯分数、唯升学,唯文凭、唯论文、唯帽子的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制。”[1]所以,要评价区域范围内各校的高考教学质量,就必须建立出一个较为客观、全面的评价系统,而这个评价系统既不同于传统课堂教学的过程式评价,也不同于甄别的选拔性结果评价。从范围来看,这个评估系统不是针对学生个人,而是针对区域和学校;从内容来看,应立足高考成绩,挖掘背后原因;从结果来看,是发现教育问题,提升质量发展;从技术来看,是容易统计操作,利于结果呈现;从绩效来看,是均衡区域和学校需求,促进区域平衡。而增值评价办法的迅速发展,为区域范围内高考质量评价体系的构建提供了方法和思路。不同类型的增值评价体系方兴未艾,较之唯平均分和唯上线率的“两唯”评价体系,确实有长足的进步,但不管哪种增值评价都不能完整地评价高考质量及其背后的因素,都有其不足之处。基于此,笔者通过尝试构建一种基于多维度的增值评价体系,期望能够较为客观地评价区域范围内各校的高考质量。
一、基于平均分和上线率的评价
高考成绩出来后,通过平均分和上线率衡量、评价一个区域内各校的高考质量,往往不会考虑学生的入校成绩和初中升高中时各校的录取分数线,其结果是部分省级示范校高考质量一直都很好,而其他学校高考质量较弱。“两唯”评价体系的优点是直观地呈现出各校的高考成绩,不足之处是忽略了一些学校在提高全区域高考教育质量中的贡献。以某区域内53所学校中的6所学校为例,经过统计后,各校的高考平均分及排名、本科上线率及排名如下:

通过上表可以看出,从高考平均分排名及本科上线率排名来看,学校A和B属于区域一流学校,学校C和D属于区域的中间学校,学校E和F相对薄弱。但实际情况是学校E和F的中考招生成绩相对较低,经过三年的高中教育,部分学生的平均分提升较大,这样就对全区域高中教育质量的提高有较大的贡献,这说明“两唯”评价体系注重最终结果评价,指标单一,忽略过程评价。
二、基于多维度的增值评价
“增值”一词源自于经济学,是指一件产品在生产过程中通过加工使得价值有所增加。增值应用于教育,主要指学校在教育软硬件上的投入能够让教育质量增加。这种将增值用于评价的理念最早是源于“泰勒原理”,美国田纳西大学的统计学家威廉·桑德斯和罗伯特威廉·麦克莱恩于1984年开发制作的田纳西增值评价系统将其应用于实际[2]。后来,基于增值的教育评价在各国都开始实施,只是各国的侧重点不同,但最终都陆续从作为教师绩效的评价转移到对于学校的评价。目前,多数的增值评价只有一个维度,就是基于标准分的增值评价,笔者经过多年的探索,在平均分和上线率的评价指标基础上,增加了两个增值评价指标。
1.基于标准分的增值评价。标准分是一种由原始分推导出来的相对地位量数。第一次考试的卷面总分分值和第二次考试的卷面总分分值不一致,就无法用原始分衡量两次考试的质量,也无法判断教育质量在两次测试之间的起伏,所以必须将两次考试的原始成绩同时转换为“标准”分数进行对比,其实就是数据标准化的过程,即用同一把尺子衡量两次考试的质量。例如,某区域中考的卷面总分分值为720分,高考的卷面总分分值为750分,由于两者的卷面总分分值不相同,用原始成绩就无法判断学生经过三年高中教育后成绩的增幅,此时把中考和高考的考试成绩转换成标准分,就可以通过比较判断三年的教育质量。特别说明,本文对中考和高考成绩进行统计分析的标准分采用我国普通高校全国招生统一考试使用的标准分,即平均分为500,标准差为100的标准分,用公式表示:标准分(Z)=((原始分-平均分)/标准差)×100+500。
例如,某校的基于标准分的增值是将该校高考成绩的标准分和当初中考成绩的标准分相减得到的差值,用公式表示:增值分=标准分2(高考成绩)-标准分1(同一届的中考入校成绩)具体示例如下。
A学校2021年毕业生高中入校成绩和高考成绩及各自的标准分及基于标准分的增值如下表:

根据以上公式,计算出全区域范围内的所有高中校的基于标准分的增值,以示例中的6所学校为例,具体如下:
通过表格可以看出,“两唯”评价中处于前几名的学校A和B,基于标准分的增值评价中并没有处于前面,而是在区域全体学校的中上。学校F的标准分增值反而紧跟学校A和B,说明该校学生经过高中三年的学习后成绩有较大幅度的提高。这种基于标准分增值的提高或者降低无法通过“两唯”评价呈现,这样评价那些高考成绩平均分不高但确实将学生成绩有所提高的学校更加客观。
然而,基于标准分的增值评价也不客观,仍以上述学校为例,学校A和B的平均分和本科上线率均位于前两名,基于标准分的增值分排名却在十几名,原因是这些一流学校本身具有“天花板效应”,中考招生成绩很高,这些高分学生很难再将其平均分提升,所以这些学校的进步空间明显比中间学校少得多。同样的道理,末流的学校具有“地板效应”,其可提升的空间巨大。所以,只用基于标准分的增值分并不能准确反应这些学校真实的教育质量。
2.基于等级百分比的增值评价。2009年美国学者Betebenner制作提出了“学生成长百分等级模型”,这个模型主要是先建立一个个学习水平相同的学生群,通过对这些学生群体中学生进行相互比较来评价每一位学生的发展情况[3]。建立不同百分等级学生分位数回归方程是该模型采用的方式,避免了以前线性回归方程评价下,不同水平的学生其发展空间不一样的难题,并且切实有效地解决了发展空间差异造成的“天花板效应”与“地板效应”,不过由于该模型必须进行分位数回归运算,因此极大程度上局限了其应用的范畴。
基于等级百分比的增值评价在“学生成长百分等级模型”的基础上提出,取其精华,摒弃了分位数回归这种相对繁琐的计算方法,采用了等级百分比的计算方式。由于计算方式相对简便,对同一区域范围内的各校进行评价时比较容易而被各类教育者所了解与认可。具体计算方式叙述如下。第一次测试后,将全体学生的原始成绩按照分数从高到低排序,接着按照一定的分数间隔(分数间隔等同于误差,其大小的确定需均衡考试的科目和分数,可认为误差内的考生学习水平相等)从高到低将学生划分成不同的等级,一个等级内所有的学生均记为0。第二次测试后,再将之前划分好的同等级内的学生进行排名,按照排名赋予学生百分比的分数,赋分公式为:百分比的分数=(1-该考生名次/同等级学生人数)×100,这种赋分保证每个学生一定有一个介于0到100的分数,50分是这个等级群体内的最中间学生,若某学生大于50则说明该学生有进步,数值越大进步越大,反之,若某学生小于50则说明该学生退步,数值越小退步越大。
将基于等级百分比的增值评价应用于评价高考质量,以学生的中考定高考,建立中考成绩水平相当的同类学生群体,经过三年高中教育后将高考成绩从高到低排名,通过对比学生在同类群体中的排名情况对学生评价。若某学生在同类群体中的排名超过一半的学生,则该学生进步,反之则该学生退步。对区域范围内全体学校的高考质量进行等级百分比的增值评价,原理相同,将该校全体学生的中考成绩作为第一次测试成绩,将高考成绩作为第二次测试成绩,算出该校全体学生的等级百分比增值平均值,若该校的分数大于50且分值越大,说明该校三年的高中教育对学生在原本的等级群体里面成绩的提升帮助很大。仍然以前面的学校为例说明,如下表:

可以看出,学校E和学校F的等级百分比增值均在50分以下,说明这两所学校的全体学生在同等级的群体里绝大多数都是低于中间值,在某种程度上说明这两所学校的高中教育质量低于中间值。学校F的全体学生中,究竟是哪些学生的进步低于中间值?可将该校的全体学生划分不同的等级,然后计算各等级的等级百分增值,再做相关的问卷具体分析,找到相应提高策略。
三、基于多维度增值评价的学校高考质量评价体系
将“两唯”评价和增值评价结合起来,就构建了一个较为完整的基于多维度增值评价的学校高考质量评价体系,分析学校高考质量时,相互对比,相互印证,可以较公正客观地反应出某学校教育质量在区域全体学校范围内的具体位置,也能反应出该校教育的相关问题。仍然以6所学校为例,将4个维度的指标综合放在一起分析,如下:

学校A和B的平均分和上线率均在区域前两名,很大程度上是因为中考录取了高分学生,但其实这两所学校学生成绩提高的幅度并不在区域前茅,说明还有上升的空间。学校C和D的平均分和上线率位于区域中上,但标准分增值和等级百分比增值处于区域中下,全体学生三年后高考成绩基本维持入校时的水平,相比学校A和B其教学质量较弱。学校E和F的平均分和上线率均在区域靠后,等级百分比增值排名更靠后,而标准分增值排名均靠前,说明这两所学校对于全区域平均分的提升有较大的作用,但是学校内部发展不均衡,大多数学生的进步不如同等级的其他学生,只是个别一些优秀的学生带动了全校的均分。
总之,在高考评价体系逐渐被教育工作者接受和肯定的背景下,高中教育要想促进学生的全面发展,必须采用多元的评价方法。基于多维度增值评价的学校高考质量评价体系相比其他的评价体系来说,改进了原有的评价方式,比较客观、公正,能分析出学校教育中存在的问题。通过多维度的增值评价可以扭转学校教育的应试化和培养的重点化,引导教育发展的方向,将教育的关注点落实到全体学生教育质量提升上,真正做到用“数据说话”,切实落实教育面向全体学生,也为深化教育评价改革提供了新的视角。
参考文献
[1]中共中央国务院印发深化新时代教育评价改革总体方案[N].人民日报,2020-10-14(01).
[2]辛涛,赵茜.基础教育质量监测评价体系的取向、结构与保障[J].国家教育行政学院学报,2020(09):16-23.
[3]徐路明,基于简易式百分等级成长模型的学业增值评价[J].中国考试,2021(04):09-14.
(本文系2020年度甘肃省“十三五”教育科学规划重点课题“兰州市基础教育质量监测评价体系的构建与实践”的研究成果,课题立项号:GS[2020]GHBZ014)
编辑:徐春霞