上海市基础教育质量评价改革十二年实践

作者: 汪茂华

上海市基础教育质量评价改革十二年实践0

【摘 要】上海市教育质量评价体系的探索与形成涵盖了丰富的内涵,主要包括:功能定位、评价指标、评价模式、评价实施系统、评价结果运用、效能支持系统。这一套体系已在上海市取得显著成效,主要表现在:义务教育优质均衡状况、学校办学活力、教师课程领导力、人民群众教育获得感、学生学习状况方面。

【关键词】教育质量评价 “绿色指标”综合评价 义务教育质量评价改革

2011年3月,上海召开了21世纪以来的第二次基础教育工作会议。会议指出,上海基础教育必须在“教育价值观念”“教育质量评价”“学生培养模式”“教师专业发展”“教育管理方式”五大方面实现转型发展。其中,对教育质量评价提出了“要从过度注重学科知识成绩,转向全面而多样的综合评价”的要求。为了贯彻落实会议精神,同年11月,上海市教委公开发布了《上海市中小学生学业质量绿色指标(试行)》的实施意见,开启了基础教育质量评价的实践探索,十二年来,已形成具有地方特色的教育质量评价体系。

一、明确了教育质量评价的功能定位

为何要开展教育质量评价?如何开展教育质量评价?整个教育系统必须首先达成共识,才能保证教育质量评价不偏离正确的方向。

1. 导向建立正确的价值观念

教育质量评价是教育价值观的体现,有什么样的评价指挥棒,就有什么样的办学导向。上海市基础教育质量评价指标包括十大方面,这十大方面体现了教育质量的构成性,它包含学生的学业水平、品德行为和身心健康等诸多领域的发展。教育质量具有关联性,包括影响学生发展的个体、教师、校长、家庭等各方面的相关因素。教育质量具有发展性,包括学业水平及相关因素的进步和均衡化程度。

2. 诊断上海基础教育的发展状况

开展基础教育质量评价的目的不是为了对学生进行选拔,也不是对区县和学校进行排名,而是为了全面了解教育质量的现状水平。提高基础教育质量的重心就是要解决学业成就背后的关键问题,通过质量评价可以将这些遮蔽的问题“暴露”出来,发现自身的不足,为进一步改进教学和调整策略提供科学依据,突破以学科知识传授为主的单一质量追求,更加关注以人的全面且多样发展为特征的全面质量。

3. 改进教育决策、学校管理及教学行为

教育是一个复杂的系统,教育质量的现状水平是多种因素共同作用的结果。其与省市(区域)教育政策的制定、教学研究的指导、学校的教育管理、教师的课堂教学、家庭的养育方式以及学生的个体特质等状况都紧密相关。不能简单地将质量评价结果的压力全部传导到学校和教师身上,因此,改进行动要从多层面、多维度、多视角切入。

随着工作的不断推进,教育质量评价项目的名称从2011年的“上海市中小学生学业质量绿色指标综合评价”修改为2015年的“上海市中小学学业质量绿色指标综合评价”,这一名称转变的背后,体现的是对教育质量评价功能定位的认识更加明确。调查信息从学生层面获取,但其结果指向的并不是个体学生,而是整个区域的教育行政决策、教学研究指导及学校教育治理。

这十二年来,我们始终把握好“高关注”与“低利害”之间的关系。一方面要求区、校高度重视质量评价,认真组织学生、教师、校长和家长参与调查活动,但强调不突击、不作假,常态化开展;另一方面不将评价结果与校长、教师绩效和学校评先评优挂钩,要求学校不得将评价结果与教师绩效、职称评聘等挂钩,消除校长、教师的后顾之忧。

二、完善了指向立德树人的评价指标与内容

2011年,从教育质量的内涵、基础教育转型发展中存在的问题和已有的教育评价实践出发,上海市研制了“学业水平”“品德行为”“身心健康”“学业负担”“学习动力”“师生关系”等十大指标(简称“绿色指标1.0”)。根据《教育部关于全面深化课程改革落实立德树人根本任务的意见》《义务教育学校管理标准(试行)》《关于深化教育体制机制改革的意见》等相关文件要求,顺应国家和上海教育改革的新形势,2018年开展了评价指标的修订完善,目前已形成“绿色指标2.0”。

1. “绿色指标2.0”体现了“德智体”向“德智体美劳”五育并举的转变

一是在原来仅包括“行为规范”“亲社会行为”这两个二级指标的“品德行为”下增加了“国家认同”和“国际视野”这两个二级指标,同时也将一级指标的名称修改为“品德与社会化行为”指标。二是在“学生学业水平”指标下增加了“学生艺术素养”。从2018年起,小学和初中都增加了艺术学科测试,体现出对学生美育的关注。三是在2021年新一轮的调查内容中增加了对学生劳动观念的调查。

2. “绿色指标2.0”适时更新调查内容,回应教育热点

根据《关于组织责任督学进行“五项管理”督导的通知》《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》《关于减轻中小学教师负担进一步营造教育教学良好环境的若干意见》等文件的精神,在2021年的学生问卷中增加了“校外补习”“作业实施”“课后服务”等内容,在教师问卷中增加了“身心健康”“职业幸福感”“教学资源应用”等内容,在家长问卷中增加了“学校家庭教育指导”“家长教育理念”“家长学业参与”等内容,体现出新时代教育发展的新特点与新要求。

三、构建了注重“科学”和“效率”的评价模式

1. 建立了“三年一测”的测评制度

在评价改革初期,为了让区县和学校明确质量评价的指标和内容,熟悉质量评价的程序和办法,2011—2014年,每年都对四、九年级的学生及教师开展调查。但教育质量的水平状况带有稳定性,存在的问题也带有长期性,很难在一年期间有很大的改变,因此“一年一测”的测评制度不是很合理。从2015年起,将评价的频次修改为“三年一测”,即以三年为一个周期,一年开展九年级测评,一年开展四年级测评,最后一年不测评。

此外,这种测评模式又建立了五年一个循环的学生纵向发展追踪数据库。由于三年一轮,九年级的测评年份为2015年、2018年、2021年等,四年级的测评年份为2016年、2019年、2022年等,因此,凡是在小学参加过四年级测评的学生,到了初中正好能参加九年级的测评,这为增值性评价的开展提供了重要的基础,为追踪、分析学生在学习上变化发展的趋势,检验基于课程标准的课程与教学实施成效,科学制定教育发展政策和有效提供公共服务给予了信息支撑。

2. 建立了“信息互证”的评价策略

为了增强调查设计的科学性,增加调查结果的真实性和可靠性,研究者设计了跨级调查。即对同一个监测指标,从不同的调查对象获取评价信息。如对教师教学方式的调查,不仅会让教师自评,也让学生进行评价。对校长课程领导力的评价,不仅让校长自评,也让教师进行评价。此外,从2015年起,还增加了家长问卷,这就让从学生层面获取的信息和从家长层面的信息实现了互证,同时,也拓展了部分信息获取的来源。

3. 建立了矩阵取样的设计方法

随着评价指标的增加,调查内容也在不断丰富,让同一个调查对象完成对所有调查问题的回答,既不合适也不科学。因此,对调查内容进行矩阵取样设计来缩短学生作答的时间,增强其参与的动机。以学生问卷为例,将所有的调查内容分成A、B、C三组,不同的组之间既有相同的内容,也有不同的内容,这样可以通过相同的内容作为桥梁,对不同对象的调查结果进行等值处理,全面刻画出学生总体在这些评价指标上的表现。每一名样本学生也不必参与所有学科的测试,而是将测试的学科分成四个组合,组合一为语文和科学,组合二为数学和英语,组合三为艺术和科学,组合四为艺术和英语,每名学生只随机参与其中一组科目的测试。这种测试科目的矩阵取样有效降低了调查对象的负担,提高了测评的效率。

四、形成了规范的评价实施系统

教育质量评价的实施涉及测评工具研制、考务管理、阅卷评分、数据分析和报告撰写等环节。从近十多年的实施情况来看,每一个环节的实施质量都会影响到整个评价工作的品质。为了保证评价工作的顺利开展,在评价实施的每一个环节都建立起了比较规范的工作流程。依据工作流程及其要求来开展工作,成为一种制度要求。

1. 建立了测评工具研制流程

如在学科评价工具研制中,建立“测试框架研制—试题编写—学生访谈—试题修订—预测试—试题分析—专家审议—试题组卷—试卷定稿”等规范化程序。问卷编制时,依照“核心概念界定—试题编写—对象访谈—问卷试测—试题修订”的流程开展问卷研制。

2. 形成了评价数据处理方法

通过学科测试、问卷调查、现场观测获得的数据资料,运用测量学、统计学的方法进行处理。综合运用经典测量理论和项目反应理论对评价数据进行处理,如采用安哥夫(Angoff)法和书签(Bookmark)法进行学业水平标准设定,运用多层线性模型统计教育质量的均衡程度等。

3. 开发了评价报告生成系统

系统研究PISA、TIMSS、NAEP等大规模教育评价项目数据库建设的经验,开发了集学科测试类、调查类、管理类数据存储与查询分析及报告生成等功能于一体的平台。在此基础上建立了“一区一报告”“一校一报告”制度。

4. 形成了评价数据解读的维度

教育质量评价数据可以从空间维度,以市、区各项指标的均值作为参照,重点解释学校在空间结构上的运转秩序和发展活力。从时间维度,以本校历年指标结果作为参照,重点解释学校在纵向时间上的发展周期和变化趋势。从主体维度,分析指标数据之间的关联,重点解释校长、教师、学生、家长之间的彼此协调与相互配合,共同促进学生发展的状态。

五、建立了评价结果运用的路径

加强对评价结果的运用是教育质量评价功能发挥的落脚点,评价结果的解析与改进实践更是对中共中央、国务院《深化新时代教育评价改革总体方案》中“完善评价结果运用,综合发挥导向、鉴定、诊断、调控和改进作用”这一要求的现实回应。

1. 围绕调查数据开展专题分析

分别以学生层面的学业发展、品德发展、身心健康等指标作为结果变量,深入挖掘影响这些结果的因素及其作用的路径与机制,形成影响学生学业成绩的因素分析、师生关系与学业成绩的关系、学习自信心的中介作用等一系列文章,为教学行为改进和教育决策制定提供了比较充分的信息。

2. 加强对薄弱学校的支撑,提供教学改进服务,发挥评价的“增值”功能

针对薄弱学校的情况,整合市、区、校三级教研的力量,在学生学习习惯、教师教学方式、学校教学管理、家校沟通合作等方面开展深度调查。发现原因后,提出有针对性的改进措施,组织专业力量对学校的教学改进提供相应的支持。

通过行政引导,形成了“提升质量、促进公平、过程科学”的教学改进目标共识,厘清基于数据的决策步骤,在评价数据和学校使命与目标间建立联系。采取“问题确认—专家指导—过程调控—展示交流”的路径,促进教学改进的持续深度探索。

3. 对区、校在教学改进实践中形成的经验进行总结提炼

利用绿色指标综合评价的数据,分析区、校在不同年度间的纵向发展情况,找出在各个方面都进步比较明显的学校。深入学校进行访谈和调查,全面了解学校在课程开发、课程实施、课程管理和课程评价中的做法,分析各个环节中提升学业质量的关键举措及其作用的机理,开展展示交流活动,对区、校在改进实践中的经验进行辐射推广。

六、构建了评价效能发挥的支持系统

要发挥教育质量评价的导向、诊断与改进功能,需要对影响成效的要素进行分析,对改进的成效进行再评估。

1. 开发教师研训课程,提升教师数据素养

教师读不懂评价结果报告,数据素养相对欠缺。教育质量评价报告中一般包含教学质量现状水平的描述,不同群体差异的呈现,不同变量间关系的分析,涉及百分比、平均分、标准差、影响系数、效应量、显著性等统计参数或专有名词。对于一些常见的参数,教师比较熟悉,但是对于比较陌生的统计参数,教师就很难理解这些参数所代表的意义,更不用说通过这些指标与教育教学中的问题、现象建立起必要的关联,因而也就造成了漠视数据、用错数据的状况。对于一些具有数理统计基础的教师来说,选择合适的方法,建立起正确分析数据的模型也并非易事。

经典小说推荐

杂志订阅