

基于STEM项目的学生高阶思维测评研究
作者: 杨地雍 首新
摘要: 研究建构指向STEM学习目标的高阶思维测试任务,拟合Rasch模型进行完善。结果发现,基于STEM项目的高阶思维进阶结构可分为四个层级,这为STEM课程设计提供了理论依据;基于STEM项目的高阶思维层级水平与年级发展一致、与性别交互作用显著。最后,从STEM课程规划和教学实施等方面提出若干建议。
关键词: STEM教育; 跨学科学习; 高阶思维; 测评
文章编号: 10056629(2024)01001807
中图分类号: G633.8
文献标识码: B
STEM教育是指整合科学(Science)、技术(Technology)、工程(Engineering)、数学(Mathematics)等学科知识和内容进行的跨学科教育。STEM学习过程始于创设真实的社会情境,与工业生产或日常生活发生联系,围绕解决一个实际问题进行创造性设计或产品改进,逐步培养学生的问题解决能力和科技素养。在“以数学为基础,通过工程设计理解科学和技术”的学习中,学生从不同视角、应用不同方法进行设计和产品完善,发展创造性思维;从诸多工程设计方案中择优选择其中一个,通过试测逐步反思设计缺陷,优化产品功效,发展批判性思维。因此,STEM学习目标是发展学生的高层次认知的过程。本研究通过对高阶思维本质的探讨,通过测试题有效表征STEM学习中高层次认知过程,以评促教,达成“为高阶思维而教”的STEM学习目标。
1 高阶思维的本质与STEM学习目标
目前,主要从三种视角阐述高阶思维。从科学哲学视角,主要揭示具有高阶思维的人的品质,如早期观点认为,具备高阶思维的人善于利用先验知识做出推断并解决问题[1]。从认知心理学视角,主要反映高层次的认知过程。在复杂而困惑的情境中,当记忆中的已知信息与新信息之间相互关联,重新排列,扩展延伸以达到某一目的或进行问题解决时,高阶思维就被激活[2]。从教育学视角,主要通过描述目标行为展现高阶思维学习结果。教育界普遍认为布鲁姆教育认知目标中的分析、综合、评价(或创造)属于高阶思维,若学生在学习活动中经历这些认知过程,则高阶思维得到了训练。
美国国家研究委员会提出,若问题解决过程需要高认知的细微判断、较为复杂、缺乏既有的规则路径、运用多个标准的,具有自调性和不确定性,那么就触及高阶思维过程。Parness等人认为[3],问题解决过程都经历了创造性思维(主要是思维发散)到批判性思维(主要是思维聚合)的过程(如图1),如寻找事实的过程中,采取多种手段搜集与问题相关的信息或资料主要是创造性(发散)思维过程,而旁求博考各方证据将问题清晰定义则是批判性思维过程;搜集想法的过程中,基于研究问题进行头脑风暴,尽可能获取多种可行的设想,这主要是创造性思维,而判定想法的合理性,基于可操作性对想法做进一步清理,获取最优化的想法,这主要是批判性思维。可见,问题解决经历了从创造到批判的过程,本质上是创造性思维(多种组合的、多样序列的思维能力)、批判性思维(理性的反思、审慎的评判)的互动和共融,最终使问题得到解决。
从学习过程来看,STEM教育项目要促进学生创造性思维到批判性思维的变化,进而达成发展高阶思维的学习目标。在着眼于设计的STEM活动中,创造性思维有助于激发尚未形成规范的设计灵感;批判性思维则更注重反思设计的合理性,寻求更切合各项标准的方案、策略等,促进产品的标准化。因此,STEM学习中所要培养的高阶思维是指在基于项目的或基于任务的问题解决学习过程中,以跨学科STEM知识为基础,顺利运用创造性思维和批判性思维为核心的高层次认知过程进行科学思维的认知或智力活动。这一界定为测量STEM活动中高阶思维提供了方法论基础,即可依据跨学科知识背景将创造性思维和批判性思维施以相对独立而又相互融合的测试任务,以此测评高阶思维。
2 基于STEM项目的高阶思维测评维度构建
基于STEM学科内容设计测试题评价创造性思维到批判性思维的认知过程,以此表征高阶思维的本质。创造性思维主要表现为思维的发散性,从思维的流畅性、灵活性、独创性等维度评估创造性思维。参考Ennis[4]、 Halpern[5]等人的观点,我们认为批判性思维的核心是推理、分析与预测、评价,因此从这三个方面评估批判性思维(一个测试任务一般只包含其中一个方面)。依据科学探究要素论、青少年科学创造力结构模型,以及有关科学教科书“科学探究”设计广度的研究[6],本研究从问题提出、方案设计、证据搜集、信息解释、物体应用、产品改进、反思评价等7个思维表现结果设计具体书面测试任务。
最终,基于STEM项目的高阶思维测评框架由三个维度构成,即STEM学科内容、高阶思维认知过程、思维表现结果,测评框架模型如图2。模型表达的基本涵义是基于STEM项目的高阶思维测评应基于STEM学科内容,就本研究而言,要基于小学科学、数学、信息技术等课程内容设计体现STEM学科整合理念的测试任务。第二,基于STEM测试任务,可从7个思维表现结果选择其中1个视角进行具体内容研制。第三,测试任务的问题要考查从创造性思维到批判性思维的认知过程。由此,三个维度形成了具有一定边界的有效系统,高阶思维认知过程与STEM测试任务融合在了一起。
3 基于STEM项目的高阶思维测试题研制
3.1 测评过程及样本
利用两轮试测修订试题,形成有效测评工具,然后进行第三轮正式测评。测试题均是以2、 4、 6年级科学、数学、信息技术等课程内容为基础设计的STEM内容,试题问题则导向高阶思维认知过程,如基于科学数学领域设计的面向4年级的“磁铁的推理”一题,依据义务教育科学课程标准对4年级学业质量要求“能利用磁铁的基本性质解释某些生活现象”,以及义务教育数学课程标准对4年级学业质量要求“能在真实情境中,合理利用等量的等量相等进行推理”进行设计。测试题突出STEM情境,基于课程标准要求进行整合性的设计,确保符合学生的认知水平和知识基础。第一轮、第二轮测试样本为方便取样,以完善测试工具,第三轮正式测评选取小学两所(市区、乡镇小学各一所),再在两所学校选取2、 4、 6年级各一个班共6个班264名学生为样本。所选市区小学的综合评价在所在地处于中等水平,所选乡镇小学为镇上两所小学之一,样本中包括市区/乡镇小学,旨在减小因城乡差异而引发的相关变量对测评结果的影响。
3.2 测试题设计及赋分标准
根据测评维度模型,测试题开发程序包括:第一,挖掘小学STEM真实材料设计试题情境,基于小学科学、数学、信息技术等课程寻找符合学生认知水平的STEM内容,并形成具有一定开放性的试题情境,以激发高层次认知过程。第二,明确试题STEM内容与高阶思维认知水平的关系,试题STEM内容要具有一定跨学科知识广度,保持每个测试题均涉及STEM学科内容,且知识具有相对独立性,试题之间没有较大重叠。为了实现依据认知过程考查高阶思维的目的,STEM知识范围要适用于引发从创造性思维到批判性思维的认知过程,且表现出认知过程的进阶性。第三,明确试题STEM内容与思维表现结果的关系,本研究所述7个思维表现结果要素是出题具体方向,它们都可与STEM内容结合在一起,使每个测试题凸显1个思维表现结果。基于上述程序设计了测试工具,样题示例见表1。
下面以从“信息解释”视角设计的一题为例具体说明(如表2)。信息解释是将获取的核心证据(信息)与最优决策方案建立有效联结,基于证据进行有说服力的解释。基于这一过程,设计生活化STEM学科情境,再利用情境化问题激发高阶思维认知过程。问题(1)考察以思维发散为主的创造性思维,问题(2)考察以思维聚合为主的批判性思维(样题指向其中的“分析与预测”),要求学生对问题(1)中的开放结果进行有边界的解释。
问题(2):你认为最可能是哪一个?请说明原因。(考察批判性思维-分析与预测)
表3是其初始评分标准。首先评估创造性思维。思维流畅性方面,该生回答了3个原因,第1个不合理,舍去,计1分。思维灵活性方面,该生分别从2个类别(人为因素、自然因素)进行了说明,计1分。思维独创性方面,施测完成统计发现,该生第3个答案频数在5%-10%范围(为6.53%),第2个答案频数大于10%(为12.81%),计1分。其次评估批判性思维,该生认为“铁门下部与地面长期摩擦,导致容易生锈”,并没有抓住铁生锈本质,计0分。最终,该同学得分:1+1+1+0=3分。值得注意的是,评分标准并非一成不变,根据第一轮试测结果,本研究会拟合部分赋值Rasch模型对开放题评分标准进行修订。
3.3 试题质量分析
本研究基于第一轮试测结果修订试题内容、水平以及评分标准,然后基于第二轮试测结果验证试题修订质量,形成有效测评工具,为第三轮正式测评奠定基础。采用部分赋值Rasch模型的计算方法,利用拟合指标、怀特图、等级概率曲线等信息评估题目。
第一轮试测后分析发现,部分题目由于太简单或太难而没有学生能力与之匹配,主要采用三种修订方式:第一,对于难度小而没有学生能力匹配的试题,直接用较大难度的试题替换;第二,对于预设水平与实测水平不符的试题,要么修改预设水平符合实测水平,要么修改试题符合预设水平;第三,对于难度较大的题目,修改内容以与预设水平相符。修订试题之后,第二轮建立怀特图发现,题目难度与被试能力匹配较好,且题目基本正态分布。另外,第一轮试测发现某些题目评分标准不合理,分值序列与平均参数估计Rasch值不匹配,等级概率曲线中的某些分值“门槛”过高或过低。主要采用两种修订方式:第一,合并某些序列等级,重新定义其含义;第二,根据学生作答情况舍弃某些维度评分,如“石桥”一题,第一轮试测后发现体现思维“灵活性”较少,于是将1分的标准从“画出1~2个形状”修改成“画出1形状”,且由于该题绘制形状并不涉及“独创性”,因而只从两个维度评分。
修订之后,第二轮测试显示绝大部分题目的加权、未加权拟合MNSQ值在0.7~1.3之间,T值在-2~+2之间,符合Rasch拟合指标,可见第一轮试题修改较为成功。随后对质量不太好的试题HI5、PR3进一步进行了修订。最后从性别、城乡等方面检验测评工具的功能差异,发现性别差异、城乡差异均不显著(p1=0.053, p2=0.562)。测评工具分离度3.82(>2),内部信度0.94,具有较好的信效度,能有效测评小学生基于STEM项目的高阶思维。
4 基于STEM项目的高阶思维测评实践
4.1 基于STEM项目的高阶思维层级进阶结构
Rasch模型将被试能力与试题难度匹配在同一量尺上,因而可透过试题分布表征学生的高阶思维水平。从分步评分怀特图发现,修订后的评分标准与被试能力发展水平基本呈对应关系,对2~6年级学生具有较为合适的测评广度,评分等级(1~4分)分布基本与被试能力(从低到高)发展一致。进一步深入测试题分析学生在4个评分等级上的得分及表现,初步勾勒出小学阶段基于STEM项目的高阶思维层级进阶结构:
处于水平1(-2.23~-0.98分
此处为Rasch分值,总体分布为均值为0,标准差为0.78。)的学生对概念之间的位属关系不时仍有疑问,这源于该水平学生采用孤立的观点分析跨学科的问题。当面对具体现象和事物时,有时能提出一些新想法,但多趋于想象,经不起精细的逻辑推理。因此,思维虽表现出较好的流畅性,但灵活性不足,与基本标准时有冲突,缺乏实践性。思维的迁移程度不高,解释过程多为重复表述,或表述不完整,推理过程存在臆断,评价过程缺少有力的知识和证据支持,因而分析过程合理性还较为欠缺,预测精准性不足。
处于水平2(-0.97~-0.08分)的学生基本能辨析相似概念之间的关系,但这一结果是基于对具体现象与事物的观察和比较,若脱离具体操作或视觉模型,他们的思维精细化水平、流畅性、推理水平会大幅度下滑。因而,思维以新颖性为主,还不具备独创性,想象成分居多,非形式推理过程中证据掌握具有一定片面性,能进行较为合理的分析,但预测的可能性不高,反思和评价过程多需要他人督促,自主性还不高。
处于水平3(-0.07~0.78分)的学生已经能综合学科概念之间的联系分析一类事物的特征,能从条件、过程、原因等角度进行判断。他们能合理展现思维灵活性,具有一些独创性的新想法,但具体实施过程的精致程度还有待提高。因而,支撑迁移与运用过程的概念模型成熟度还不够,思维以灵活性为主,同时兼顾合理性,已形成能规范、正确地基于证据的推理,能掌握一定的手段对信息进行分析和解释。评价过程能兼顾他人观点,对过程已具备一定的自我监控和反思意识,但主观性仍然较强。