

师幼互动质量与学前儿童学业能力之间关系的三水平元分析
作者: 李莉 王楠 张李斌 张云运
*基金项目:北京师范大学博士后研究项目“我国幼儿园师幼互动质量评估指标体系构建”、河南省高校人文社会科学研究项目“关注过程质量的河南省城乡幼儿园保教质量观察评估的难点调查及对策研究”(编号:2023-ZZJH-147)
**通信作者:张云运,北京师范大学中国基础教育质量监测协同创新中心教授,博士,博士生导师
[摘 要] 师幼互动是影响儿童学业能力发展的重要近端因素,但关于两者之间的关系一直存在争议。本研究基于来自欧美和中国等地的38项实证研究、406个效应量和405 769名3~6岁儿童样本,运用三水平元分析的方法,全面探究师幼互动质量与学前儿童学业能力之间的关系。结果显示:师幼互动三个领域(情感支持、班级管理和教学支持)的质量与儿童的三项学业能力(语言能力、前读写能力和数学能力)之间均存在不同程度的显著弱相关(r=0.07~0.15);在调节因素中,仅国别对两者之间的关系产生了显著调节效应,且中国样本的相关程度显著高于其他国家样本。建议未来研究从系统、动态、长期的视角深入探讨师幼互动对儿童发展的影响机制,从非线性的视角探讨教育质量对儿童发展的影响,研制具有中国文化适宜性和实践导向的师幼互动质量评估工具。
[关键词] 师幼互动;儿童学业能力;元分析
一、问题提出
近二十多年来,国内外大量研究表明,学前教育过程性质量中的师幼互动质量是直接影响儿童发展的重要近端因素,对儿童学业、社会性、执行功能等方面的发展具有显著影响。[1][2][3][4]目前,国内外普遍使用美国开发的观察评估工具《课堂评估评分系统》(Classroom Assessment Scoring System, 简称CLASS[5])从情感支持(Emotional Support/ES)、班级管理(Classroom Organization/CO)和教学支持(Instructional Support/IS)三个领域考察师幼互动质量。[6][7]梳理已有研究可以发现,有关CLASS评估的师幼互动质量与儿童语言、认知、情绪社会性、执行功能、学习品质等各个领域发展之间关系的研究成果并不均衡,更多研究关注的是师幼互动质量与儿童学业能力之间的关系。一些研究认为,师幼互动质量对儿童学业能力发展有显著积极影响:情感支持显著影响儿童的阅读(字母或词汇识别)、数学发展[8]以及语音意识;[9]班级管理显著预测儿童的前读写、数学学业表现[10]以及阅读和词汇的发展;[11]教学支持不仅可以预测儿童在学前阶段的语言、前读写和数学表现,[12][13][14]还可以预测小学阶段的学业水平。[15]但大部分研究都显示,两者之间虽存在显著相关,但相关程度较低。[16][17][18]还有一些实证研究显示:情感支持与儿童数学表现没有关系;[19]教学支持与语言能力之间没有关系;[20]师幼互动三个领域与语言能力[21]、前读写能力[22][23]均无关系;师幼互动三个领域与儿童的三项学业能力[24][25]均无关系。鉴于已有研究的结论并不一致,有必要借助系统性文献综述或元分析的方法厘清它们之间的具体关联以及关联程度。然而,目前已有文献综述和元分析研究仍未能达成共识。如2016年的一项元分析结果显示,师幼互动的三个领域与儿童语言发展(含语言能力和前读写能力)和数学发展之间均不存在显著相关。[26]而2019年的两项系统性综述却显示,教学支持与儿童语言和识字能力、班级管理与儿童识字能力均存在显著相关,但三个领域与儿童的数学能力不存在显著相关;[27]师幼互动三个领域与儿童语言发展(词汇、语音意识、字母知识等)存在显著相关。[28]2022年的一项元分析结果也显示,师幼互动三个领域的质量与儿童前读写能力均存在显著相关。[29]
不同研究之间存在较大差异的原因之一可能是受到潜在调节变量的影响,[30]不同研究的方法特征都可能成为导致不同研究之间出现结论差异的潜在调节变量。[31][32][33]首先,不同研究的儿童样本及研究者来自不同的国家或地区,不同国家或地区的师幼互动质量与儿童学业能力都会存在一定的差异,这就必然会造成不同研究之间的差异。教育系统的成果不仅取决于过去和现在的教育资源、政策和实践,还取决于一个国家更广泛的文化、经济、社会和制度。[34]不同国家的经济文化特征、教育事业目标、家庭及社区环境特点等,不仅会影响幼儿园教育质量、教师的教育观和儿童观以及儿童的学习与发展水平,更重要的是还会潜在影响研究者对教育质量和儿童发展结果的解读。随着教育评估在世界范围内的广泛开展,人们逐渐意识到,在显性的量化指标之外,隐藏在评估主客体、工具方法等各种评估要素中的主观性因素也会左右评估的过程和结果。[35]其次,年龄是重要的样本特征之一,不同年龄(即不同年级)的师幼互动质量与儿童发展的关系可能存在差异。已有研究认为,师幼互动与大班儿童发展之间的关系比与中班和小班之间的更强,这可能是由于大班师幼互动质量普遍高于中班和小班。[36]由于大班儿童的言语和认知能力都在提升,与教师的主动互动,尤其是在学习和常规方面的互动增多,从而使得两者之间的相关程度增强。[37][38]通过探究国别及年龄对师幼互动与儿童学业能力之间关系的调节作用,有助于我们找到导致不同研究之间差异的影响因素。
综上,已有研究对师幼互动质量与学业能力之间的关系以及相关程度仍众说纷纭,甚至存在矛盾之处。而已有元分析在纳入文献、调节变量、探究的广度和深度方面也存在一定局限,未能基于最新研究成果全面剖析师幼互动质量与儿童学业能力之间的关系。因此,本研究基于近十五年来国内外在此领域的实证研究结果,使用三水平元分析的方法进行综合、比较和分析,以检验师幼互动三个领域的质量与儿童三项学业能力(语言能力、前读写能力和数学能力)发展之间的关系,并考察国别和年龄的调节作用,以期为以师幼互动为支点推动学前儿童学业能力发展的教育实践提供更多的证据支持和启示。
二、研究方法
(一)文献检索与筛选
鉴于CLASS自2008年出版和使用,本研究使用中国知网、万方、维普、Web of Science核心合集、EBSCO(含Academic Search Ultimate和ERIS)、ScienceDirect等中英文学术搜索引擎对2008年1月至2022年12月的中文和英文文献进行检索和筛选。中文数据库的检索词包括:(1)师幼互动相关:“师幼互动+教师儿童互动+教师幼儿互动+CLASS+情感支持+班级管理+课堂组织+组织支持+教学支持”;(2)学业能力相关:“学业+语言+数学+识字+早期读写+前读写+阅读”;(3)学段相关:“学前教育+早期教育+幼儿园+托幼机构”。英文数据库的检索词包括:(1)师幼互动相关:“teacher?鄄child interaction OR“teacher* interaction” OR CLASS OR emotional support OR classroom organization OR organizational support OR instructional support”;(2)学业能力相关:“academic* OR language OR literacy OR pre?鄄literacy OR reading OR math OR numeracy”;(3)学段相关:“ECEC OR ECCE OR preschool OR kindergarten OR pre?鄄k”。中英文的三类检索词均用“AND”组合。
依据PRISMA标准,本研究的文献筛选标准包括:(1)必须为实证研究,且师幼互动质量为自变量或预测变量,儿童学业能力为因变量;(2)使用CLASS测量师幼互动质量,并至少报告一个领域的质量得分;(3)明确介绍儿童学业能力的测评工具及其得分;(4)报告了至少一个领域的师幼互动质量与一种儿童学业能力之间的关系,能够提取到相关系数(r),或其他可以计算相关系数的统计量;(5)师幼互动质量的评估时间必须是在学前教育阶段(年龄范围在3~6岁),儿童发展的测评时间必须包括但不限于学前教育阶段;(6)仅纳入代表普遍群体(含低收入家庭)的儿童样本,排除特殊儿童或少数民族、仅说小语种等特殊群体的样本。(见图1)对于因没有提供数据而无法提取效应量的文献,联系了8位作者,但并未得到回复。本研究最终纳入38篇文献,均为SSCI来源期刊发表的论文,且均报告了儿童样本、评估工具、数据收集与分析过程等关键信息,确保了纳入文献的质量和下一步编码工作的开展。
■
图1 文献筛选流程图
(二)文献编码
首先,由本研究的两位作者根据以下特征各自独立编码纳入的文献:(1)文献代码(第一作者+出版年份);(2)样本量(儿童数和班级数);(3)样本国家(1=中国,2=美国,3=欧洲国家,4=其他国家);(4)平均年龄;(5)师幼互动质量(Q1=情感支持,CLASS的ES领域得分;Q2=班级管理,CLASS的CO领域得分;Q3=教学支持,CLASS的IS领域得分);(6)儿童学业能力(D1=语言能力,包括接受性语言和表达性语言;D2=前读写能力,包括语音意识、语素意识、字词识别或命名、前阅读、前书写等;D3=数学能力);(7)效应量r及数量。本研究在提取效应量时遵循以下原则。首先,如果文献报告了相关系数,则直接提取所有与研究主题相关的相关系数。其次,如果文献没有报告相关系数,而是报告了F值、t值、卡方值或回归系数等,则通过公式将其转化为相关系数r。[39]再次,如果一项研究采用多个工具测评同一学业能力的不同维度(如语言能力一般会采用两个不同的测评工具,分别测评接受性语言和表达性语言),其报告的所有符合筛选标准的学业能力测评得分与师幼互动质量之间关系的数据,都将被提取为独立效应量进行编码。最后,如果一项研究采用不同的测评工具,分别测量了儿童的语言能力、前读写能力和数学能力或其中的两种能力,但并未报告不同学业能力各自的测评得分与师幼互动质量之间的关系,只报告了测评总分与师幼互动质量的关系,则视为无法提取效应量。
然后,本研究将两位作者独立完成的编码进行Kappa评分者信度检验,一致性为95.8%。对于编码中的不同意见,研究者对其进行讨论,直至达成一致意见。编码后可以看到,共纳入38项独立研究,提取了406个效应量。其中,27项研究来自美国,5项研究来自欧洲国家,4项研究来自中国,2项研究来自其他国家。(见表1)
表1 纳入文献的基本信息
■
注:“—”表示未报告此数据。
(三)数据处理与分析
首先,本研究在计算主效应或调节效应时,将所有相关系数转为Fisher’s z分数,在计算完成后,再将其转为相关系数。其次,鉴于本研究纳入的文献大多是同一研究报告了多个效应量,因此采用三水平元分析的方法进行异质性检验、主效应和调节效应检验。三水平元分析是在传统元分析对抽样方差(水平1)和不同研究之间的研究间方差(水平3)进行分析的基础上,增加了同一研究提取的效应量之间的研究内方差(水平2),以处理来自同一研究效应量之间的依赖性问题,从而提高了统计检验力。[40]再次,采用失安全系数(Classic Fail?鄄safe N)和Egger线性回归法来检验元分析结果是否存在发表偏倚,并采用逐步移除法检验元分析结果的敏感性(即稳健性)。发表偏倚(publication bias)是指已发表的研究文献不能系统全面地代表该领域已经完成的研究总体,这会影响元分析结果的可靠性。敏感性是指元分析结果可能会受到异常值的影响,导致虚假的统计结论。[41][42]当存在显著的发表偏倚时,应采用剪补法(Trim and fill method)进一步检验。[43]
分析内容包括主效应检验和调节效应检验。主效应检验采用三水平元分析探究师幼互动三个领域质量与儿童三项学业能力之间的关系;调节效应检验采用三水平元分析,探究国别和年龄对师幼互动质量与儿童学业能力关系的调节效应。其中,为了探究中国与其他国家的研究是否具有显著差异,将国别分为中国和其他国家(含美国、欧洲国家等)两类。本研究使用R x64 4.3.0-win版本的metafor包,按照阿辛克和维伯林克(2016)的教程编写 R 语法进行三水平元分析。[44]