

学习科学视角下的隐马尔可夫模型
作者: 张鹏 苏晗宇 张媛媛 尚俊杰
摘 要:学习过程分析是学习分析的核心议题,但常因理论依据与分析技术之间的融合不佳,而限制了对教育意义的深入解释。隐马尔可夫模型(HMM)可以有效结合学习科学理论经验和模型构建,为解决此困境提供了一种简单、透明、可解释的方案。因此,从HMM分析方法切入,详细介绍了HMM的基本组成及其在教育中的重要应用价值,说明如何基于HMM建模学习过程和预测学习成果,强调了学习科学理论与数据相结合的重要性。通过多个案例分析,展示了HMM在游戏化学习、学业成就预测和自我调节学习过程分析中的典型应用。最后,总结了HMM在教育研究中分析组别差异、多阶段过程和多通道过程的三大方向与策略,为未来更有教育意义的学习分析研究提供理论与实践指导。
关键词:学习过程;学习分析;隐马尔可夫模型;学习科学;研究方法
中图分类号 G43 文献标识码 A 文章编号 1005-4634(2025)01-0001-10
0 引言
学习分析通过数据揭秘教育本质,是教育数字化转型的关键推力[1]。学习过程分析旨在基于过程数据反映学习者的学习状态与潜在的教育规律[2]103,关乎学习者与环境的交互、学习者的认知思维发展和最终的学习成果,是学习分析的核心议题[3-4]。在教学中,只有深入理解学生的学习过程,才能更有效地为优化学习体验和提高教学效果提供支持。随着数据采集技术的发展,学习过程分析研究逐渐呈现出多通道和多模态的发展态势[5 ]60,[6]。通常研究者会收集学习者在学习过程中与学习环境之间交互的多维数据[7],包括但不限于学习者的行为数据、情感数据和认知数据等。这些数据相较于传统的问卷量表与课堂观察记录显得更为零散且缺乏明显规则,但往往蕴含着丰富的潜在信息[2]103。面对如此海量的多模态和多通道时序数据,研究者面临着一项重要挑战:如何从中挖掘出具有教育意义的潜在规律?
围绕这一核心挑战,已有研究从分析技术与理论依据两方面入手提供应对方案。在分析技术方面,众多研究者已经开始广泛应用机器学习方法、数据挖掘技术来分析学习过程数据[8-9],挖掘其中可能有价值的潜在信息。例如,滞后序列分析可以揭示学习行为之间的时间依赖关系[10],聚类分析可以通过分组相似的行为模式来识别不同的学习路径[11-12]。这些基于行为的微观分析可以清晰展现学习者的行为转换模式[13],但却无法直接揭示更具有概括性的教育构念(如学习动机、学习状态等用于解释学习规律和结果的核心概念)及更具推广性的学习规律,这使得理论的介入以增强教育解释力度变得尤为重要[14]。在理论依据方面,研究者充分意识到了理论对于学习过程分析的关键作用[15]。学习科学作为探究“人是如何学习的”以及“如何促进有效的学习”的跨学科研究领域,融合了来自教育学、信息科学、认知神经科学等多领域的理论成果[16],这一综合性视角使得学习科学能够深入剖析学习的本质,探究学习的基础机制,从而全方位地揭示学习发生的过程。结合学习科学理论,研究者能够更加科学、深入地实施学习过程分析的各个环节,包括指导研究者在模型中甄选变量、识别数据中的潜在混杂因素、抉择值得关注的结果以及阐释研究结果。例如,有研究者使用社会调节学习理论指导学习行为序列的编码过程[17];也有研究者指出自我调节学习和社会建构主义理论常被用于解释分析结果[18]。尽管理论在这些方面起着至关重要的作用,但在实际分析过程中,理论通常仅限于提供分析的起点和阐释结果的框架。随着分析进入深层次的数据挖掘阶段,理论的影响力逐渐减弱,这导致学习过程分析面临理论依据与分析技术无法良好融合的困境,严重限制了对研究结果教育意义的深入阐释。
以揭示潜在信息为最大优势的隐马尔可夫模型(Hidden Markov Model, 简称HMM),正为这一困境提供了简单、透明、可解释的解决方案[19]784。从学习科学的视角出发构造HMM,能够更好地发挥其在学习分析领域的优势,增强其在教育方面的可解释性。从技术原理角度,HMM能够通过概率运算建构出最大可能出现的教育构念及其转换规律,揭示数据背后最可能蕴含的教育规律[20]41;而从理论融合角度,HMM是将理论依据充分融合学习过程分析的良好体现,将学习科学理论天然地融入到教育构念的特征建构之中,极大地增强了分析结果的理论深度和教育解释力度[21]5497-5498。此外,正如李海峰和王炜指出的,学习分析主要是通过预测模型和解释模型两类技术解密学习本质[5]62。HMM正是解释模型,并能够和学习成果关联构建预测模型,在教育领域中具有较强的灵活性和通用价值。
综上可知,面对复杂的时序数据,学习过程分析尤其强调潜在的教育规律的揭示,这一过程离不开理论和数据的深度融合。HMM作为一种灵活且易于解释的学习分析技术,显示出了其在揭示复杂数据背后规律和整合理论方面的巨大潜力。本研究旨在从学习科学视角出发,深入探讨HMM在学习过程分析中的应用,包括其分析步骤、典型案例和应用方向与策略,以期为学习过程分析研究者揭示潜在的教育规律提供示例与方法,推动学习分析领域的进一步发展。
1 隐马尔可夫模型概述
1.1 HMM的概念及其重要应用价值
隐马尔可夫模型是一种基于概率的统计学习方法,于20世纪60年代末至70年代初由Leonard等研究者提出并得到发展。HMM多用于解决线性序列问题,能够从可观测的序列数据中挖掘这一过程中最可能的隐藏状态及状态之间的转移路径。由于这一特点,HMM自提出以来便在语音识别[22]、词性标注[23]、蛋白质结构预测和基因序列分析[24]等诸多现实场景中得到广泛应用。
学习者在学习过程中通常会产生多样化的具有时序特性的可观测数据,例如点击流数据、平台日志数据、学习者交互行为数据等。HMM能够从可观测数据中推断其背后蕴藏的潜在信息,为打开学习过程的“黑箱”提供了可解释的有效途径。目前,许多教育研究者使用HMM来揭示学习者的学习过程,从而刻画其深层次的学习状态[25],或基于此预测该学习者的学习成效。程罡等人使用HMM识别了学生在学习周和考试周两个课程阶段所展现出的学习策略及活动模式[26]42;Geigle等人则借助一类双层HMM对学生鼠标点击活动建模,揭示了不同学业表现的学生所展现的不同活动模式[27];Witteveen等人使用学生的成绩单数据建立HMM模型,用于预测学生在高等教育中能否顺利毕业[28]449;张思等人对学生在私播课论坛上的对话数据编码,借助HMM模型识别学生在协作学习中所采用的交互模式[29]。
由此可见,HMM在学习分析领域具有重要的应用价值,尤其是在对学习过程的刻画和分析上。对于学生而言,使用HMM分析和梳理学习过程能够更清晰地了解自己的学习模式,从而有针对性地调整学习策略;对于教师而言,通过HMM挖掘学习过程中不易观察的潜在学习状态,有助于识别学生存在的问题并及时实施教学干预;对于教育研究者与管理者而言,使用HMM能够有效地预测学生的学习成效,识别学业风险,为其作出合理且有效的决策提供指导。
1.2 HMM的技术特点
HMM包含两个序列:一个是由可观察的变量组成的序列,称为观测序列;一个是用于描述隐藏状态的序列[30]。在学习过程分析场景下,观测序列通常由学生的行为、表现等可被直接观察和记录到的时序数据构成,而隐藏状态序列则视研究问题而定,通常能够反映隐含在学习者行为、表现中的教育构念,如学习状态、学习模式、调节过程等。在完成HMM建模后,Viterbi算法通过动态规划的方式,逐步计算出该观测序列下每个隐藏状态的最优概率,并据此推断最可能出现的隐藏状态序列,这是HMM的核心问题之一。在教育中,这一过程即表示通过学习者的行为、表现揭示潜在教育构念。此外,HMM还包含三个重要的核心矩阵:初始概率矩阵表示起始时刻处在各隐藏状态下的概率、状态转移矩阵表示隐藏状态之间相互转换的概率、发射矩阵则表示在当前时刻隐藏状态下观察到特定可观测状态的概率。上述参数是使用HMM进行学习过程分析的重要依据,例如状态转移矩阵展现了不同类型教育构念之间的转换规律。
传统的HMM进一步发展出许多扩展模型,从而适应更多样化的数据类型和特征。对于有限的离散型观测数据,例如学习环境触发的事件标签(如“成功”“失败”),可以直接使用传统HMM建模;对于连续数值的变量,例如学习时长,则通常使用高斯HMM进行建模;而针对混合型数据,则可以使用混合HMM建模,通过特征融合,将离散和连续的数据整合为统一的特征输入HMM。对于其他复杂的数据,还需通过数据预处理将其转化为适合HMM输入的数据类型,例如针对平台日志等时序数据,需要根据数据特征划分时间窗口,将其转化为离散或连续的序列形式。
1.3 HMM工具包——hmmlearn和seqHMM
目前学界还缺乏集成HMM的专业软件,但Python和R语言提供了专门计算HMM模型的第三方库,不需要用户掌握HMM复杂的内在算法逻辑并且适用于多种数据类型。具体而言,hmmlearn是Python中处理HMM的第三方库。根据数据类型及数据分布在该库中选择合适的HMM模型,包括“GaussianHMM”“CategoricalHMM”“MultinomialHMM”等。在建立模型的基础上,利用函数对模型及模型参数进行操作。例如,使用fit函数训练HMM模型,使用参数名“startprob_”“transmat_”“emissionprob_”输出HMM的三个核心矩阵,使用“score”函数计算产生特定观测序列的概率,通过“decode”或“predict”函数,可以推断出与给定观测序列最相关的隐藏状态序列,从而深入分析学生的潜在学习状态。
在R语言中可对应使用seqHMM工具包[31]2,建模过程与hmmlearn相似。“build_hmm”和“fit_model”函数分别用于构建和训练HMM模型,三个核心矩阵数据存放于变量“initial_probs”“transition_probs”“emission_probs”中。为了能够更直观地展示模型,该工具包中集成了可视化方法,例如,“plot(hmm [XCS.TIF] model)”函数能够形象地展现HMM的结果:隐藏状态以节点形式呈现,每个隐藏状态是一个饼状图,初始概率显示在节点下方;发射概率表示为饼状图的切片比例;转移概率以顶点之间的箭头粗细表示大小。
2 学习科学视角下基于HMM的学习过程分析流程
在学习科学的视角下,HMM兼具学习过程解释和学习成果预测双重功能。作为解释模型,HMM能够建模学习者的学习过程,通过对学生在某个阶段的多通道的行为、活动、表现等序列数据描述、解释和分析,揭示潜在的学习规律;而作为预测模型,HMM能够基于过程数据,通过建模学习过程预测学习成果,有效地将学习过程与学习成果关联起来。虽然上述两类问题均以学习过程数据的分析为主,但分析过程却存在差异。
2.1 基于HMM建模学习过程
学生在学习过程中会产生各种各样可观察和记录的数据,HMM的优势之一就是能够基于可观测序列数据建模学生的学习过程,从而挖掘内隐的规律。如图1所示,在学习科学视角下使用HMM建模某一群体某一阶段的学习过程的具体步骤包括六步。
(1)确定研究问题:研究问题的确定是特征选择、结果解读的前提,通常使用HMM的研究者是为了揭秘学习者在某一主题的学习过程中的某一教育构念(如活动模块[21]5499,[26]33、学习策略[20]2-10等)的分布与变化规律。
(2)选取观察特征:HMM建模的效果很大程度上取决于特征的质量。研究者需要根据研究问题、理论依据和实际数据情况,选择或编码HMM的观察特征,形成观测序列。例如,程罡等人选择学生在线课程中产生的12个学习活动数据作为观测数据[26]42;而Tang等人则将学生在完成练习题过程中产生的行为日志数据重新编码,并以此为观察特征[21]5498-5499。在重新编码特征的情况下,研究者必须参考学习科学相关理论或依据学科领域经验制定合适的编码方案,且由多位研究者参与编码,保证编码方案的信度和效度(专家评估、理论验证等)。初步选取后,结合主成分分析、相关分析等剔除掉信息量不高的特征选项,由信息量较高、具有理论依据的特征组成最终的观测序列。
(3)确定隐藏状态数量:一方面可以借助理论知识与领域经验确定隐藏状态数目,另一方面也可以将不同状态数目下的AIC(Aikaike Information Criterion)、BIC(Bayesian Information Criteria)等统计指标作为依据[32]。一般来说,AIC值越小说明模型的拟合能力越强,BIC值越小说明模型的结构风险越小。研究者可借助这两种方法确定合适的隐藏状态数量。在教育场景下,将隐藏状态划分为两态或三态的做法较为常见[33]。