在线课程中知识追踪技术的应用研究
作者: 赵艳 张欢 贺媛婧 郑晨
关键词:知识追踪;在线课程;个性化学习;深度学习;智慧教育
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2024)28-0171-06
0 引言
近年来“互联网+”教育不断推进,在线教学平台越来越普及,为学习者提供了开放、灵活的自主学习途径,在线学习者的规模也逐渐增大。然而传统在线教学平台中普遍缺乏个性化教学手段,教师通常会在开课前预设好整套学习资源,包括文本讲义、音视频课件、作业测验等,一旦课程开启,学生便需按照既定的学习路径进行,浏览这些预先准备好的资源。教学活动大多局限于论坛上的简单交流、教师偶尔进行的直播答疑等,与学生的实时互动相对较少。这样的模式在某种程度上限制了学生学习的自主性和深度,特别是对于成人学习者而言。大多数成人学习者学习时间灵活、学习水平和偏好存在较大差异,在线课程中静态的学习资源、单一的教学模式、普适化的测评手段、有限的交互式学习活动已经不能满足他们多样化、个性化的学习需求。再加上教师数量远不及学生数量,教师不可能充分了解每个学生的知识状态和学习进度,难以为学生提供及时、有效的学习指导[1]。
解决上述问题的一项关键技术是知识追踪,知识追踪是支撑智慧教育系统的核心技术,近年来受到研究者们的广泛关注[2]。知识追踪是指根据学生的历史答题记录来自动追踪学生的知识状态随时间的变化过程,以预测学生在未来学习中的表现。基于知识追踪的结果,教育者可以及时了解学习者的知识掌握情况,学习者可以找到高效的学习路径和恰当的学习资源。因此,本研究关注在大规模在线课程中如何利用知识追踪技术辅助个性化教学,为教师和学生提供个性化的学习支持服务,以培养师生形成足够的个性化教与学能力,为知识追踪技术在智慧教育领域的应用提供参考。
1 知识追踪技术的相关研究概述
1.1 起源
学习者知识状态建模是辅助个性化学习的关键路径之一,早期的研究根据测试成绩从宏观角度对学生进行评价分析,如经典测量理论、概化理论、项目反应理论等。后续有研究者进一步提出以认知诊断为代表的新一代测量理论,认知诊断来源于心理测量领域,通过测量学生个体内部心理对知识的加工过程分析学生的知识状态。但上述方法通常只基于某一时刻的测验成绩对学生知识状态进行评估,并假设学生知识状态在短时间内是固定不变的。然而,在实际场景中,学生的知识状态跟随学习过程动态变化,及时追踪学生的知识状态对于个性化学习具有十分重要的意义。基于此,美国卡内基梅隆大学的Corbett和Anderson于1995年提出知识追踪任务[3],旨在通过学生历史的学习数据,动态跟踪学生的知识水平的变化情况。此后,知识追踪受到了教育领域和数据挖掘领域研究者的广泛关注。
1.2 基本定义
知识追踪任务可以形式化地表示为一个有监督的序列学习任务,如图1所示,学生在学习过程中,与不同知识点的习题交互,产生一个习题历史作答序列,包含习题信息、习题关联的知识点信息以及学生作答的正确与否信息。知识追踪模型将该序列作为输入,通过对习题历史作答序列建模,预测学生对下一道习题的作答结果与知识状态。知识追踪建模通常基于学习者学习过程中的测评性数据和特定的数学模型,随时间的推移对学习者的知识掌握状态进行动态估计,同时可以对学习者的答题表现进行预测。
1.3 分类
1) 基于贝叶斯的方法
贝叶斯知识追踪模型(Bayesian Knowledge Trac⁃ing,BKT) 将学生的学习过程看作隐马尔可夫过程,将学生的知识状态表示为一组二元变量,变量取值为1 或0,分别表示学生对知识点的掌握与否,将学生的历史答题情况作为观测变量,使用贝叶斯概率公式计算在当前观测变量下学生的知识掌握概率。但BKT模型并没有考虑到真实学习环境中的复杂场景,如某些习题的知识状态不能简单地表示为二元变量、各知识点存在一定的关联关系,并非相互独立、学生在学习过程中必然会存在遗忘行为,针对这些不足,后续出现了对BKT的改进模型[4-6]。
2) 基于逻辑回归的方法
逻辑回归是一种基于逻辑函数的预测模型,该函数输出在[0,1]之间取值,通常用于分类任务的建模。21世纪初,研究者们提出将逻辑回归模型用于知识追踪任务,以学生正确作答习题的概率为因变量,将学习者的能力、知识点难度、学习率、学习行为等因素作为参数建立逻辑回归模型来进行答题预测。基于逻辑回归的知识追踪模型采用项目反应理论或因子分析方法[7-9],并充分利用逻辑函数易于实现、计算复杂度低等优点,将知识追踪问题转化为逻辑回归中的分类问题,在模型预测准确性上基本优于基于贝叶斯的知识追踪模型。
3) 基于深度学习的方法
深度学习是一种新兴的人工智能方法,近年来在计算机视觉、语音处理、自然语言处理等领域中发挥着重要作用,也被逐渐应用于知识追踪任务。Piech 等于2015年首次将深度学习引入知识追踪领域,提出深度知识追踪(Deep Knowledge Tracing,DKT) 模型,使用循环神经网络建模学生作答交互序列的时序关系,获得知识状态的高维连续表征并预测学生的未来表现[10]。有研究者将DKT应用于开放式的学习环境中,如编程练习[11]、发现知识点间拓扑顺序[12]、生成试卷[13]等。
后续又出现了DKT的扩展模型,如增强的深度知识追踪模型DKT+[14]、基于动态学生分类的深度知识追踪模型DKT-DSC[15]等。DKT模型取得广泛关注后,其他基于记忆网络[16-17]、注意力机制[18-19]和图神经网络[20-21]的深度学习方法被研究者陆续应用于KT 任务中。
综合对比这三类方法:1) 从模型输出结果的精细化程度来看,由于隐马尔可夫模型本身隐状态的限制,贝叶斯知识追踪模型的建模结果只有掌握或未掌握两种离散值,并不能获得表示学生知识点掌握程度的连续值。基于深度学习的知识追踪模型可以通过权重参数得到学习者对知识点的掌握概率,其范围为0~1之间的连续值[22]。2) 从建模能力来看,基于贝叶斯和逻辑回归的方法一般基于单一或少量知识点进行建模,难以捕获习题序列中的长期依赖关系,而基于深度学习的知识追踪模型具备强大的特征提取与表征能力,可以较好地建模多知识点和大规模学习者的作答序列信息。3) 从模型的应用范围来看,由于基于贝叶斯的知识追踪模型简单、可解释性强,已被广泛应用到各类智能导学系统中。而基于深度学习的方法虽然尚未广泛应用,但已成为当前的研究热点,具有良好的应用前景。
2 深度知识追踪技术的实验过程与结果分析
由于基于深度学习的知识追踪方法建模能力较好,输出的预测结果更为精细化,也更契合大规模在线教学的应用场景,因此,使用基于深度学习的知识追踪模型在四门在线课程上开展实验,对学生个体知识状态变化过程和学生群体知识状态分布进行可视化分析。
2.1 数据说明
本研究选择临床中医药应用、抗美援朝精神、从创新思维到创业实践、计算机应用基础四门课程作为实验数据,前三门课程来自开源数据集MoocCubeX[23],记录了2020年下半年的学生作答数据。计算机应用基础课程来自某开放大学教学平台,采集了某个分部2022年春季学期的学生、习题和作答行为数据。由于在线教学平台的实际业务中并不存在知识点标注、习题绑定知识点的功能,无法得知这四门课程中的习题与知识点的关联关系,只能依赖教师人工标注出知识点的层级结构,但习题与多层级知识点的关联关系十分稀疏,因而本研究使用习题对应的课程章节信息(可粗略认为是一级知识点)代替知识点信息,探究学生在章节上的掌握情况。
表1显示了每门课程相关信息的统计情况,可以发现这四门课程中平均每个学生作答的习题数量和平均每道习题作答的学生数量均比较高(均占总习题和总学生数量的75%以上),说明学生的历史作答交互序列质量较高,可以作为实验对象。所有课程的习题作答交互数据按照8:1:1的比例随机划分为训练集、验证集、测试集。
2.2 实验过程
1) 数据预处理
图2是数据经过预处理后的一个样例,包含用户ID、习题ID、每道习题对应的知识点ID、学生对每道习题的作答是否正确以及作答序列长度。这些数据经向量化处理后作为模型的输入。
2) 知识追踪方法说明
本研究利用五个基于深度学习的知识追踪模型在四门课程上进行实验,分别是深度知识追踪DKT[15]、增强的深度知识追踪DKT+[24]、动态键值对记忆网络DKVMN[26]、自注意力知识追踪SAKT[29]和上下文感知的注意力知识追踪AKT[30]。这五个模型均为经典的深度知识追踪模型,本研究使用PyTorch对模型进行了实现,模型结构不在本文中详细展开。
DKT:使用循环神经网络对学生的习题作答记录进行建模,追踪学生知识点掌握程度随时间的变化过程,是首次将深度学习引入知识追踪领域的模型。
DKT+:为改善DKT模型中输入序列的重构问题和预测结果的波动性问题,提出增加正则项的方法,得到增强的DKT模型。
DKVMN:借鉴记忆增强的神经网络MANN方法,用一个静态矩阵和一个动态矩阵分别存储知识点信息和知识点状态信息,通过读写机制追踪学生知识状态的更新过程。
SAKT:利用注意力机制从学生的习题作答记录中提取与当前知识点相关的信息,是第一个基于自注意力机制的知识追踪模型。
AKT:使用两个基于单调注意力机制的编码器来学习习题和回答的上下文感知表征,并使用认知和心理测量理论中的Rasch模型来规范知识点和习题的表示,能够在不引入过多参数基础上捕捉同一知识点的习题之间的个体差异。
2.3 实验结果
为了评估基于深度学习的知识追踪模型在四门课程上的表现,大多数知识跟踪模型研究工作均采用受试者工作特征ROC(Receiver Operating Characteris⁃tic) 曲线下与坐标轴围成的面积AUC(Area UnderCurve) 和准确率ACC(Accuracy) 来评价模型的表现,本研究遵循这一做法。AUC是衡量二分类模型优劣的一种评价指标,表示正例位于负例之前的概率,能够很好地描述模型整体性能的高低,ACC是模型预测正确分类的样本数占样本总数的比例。模型的性能与AUC和ACC的值成正比关系,取值越大表示模型预测性能越好。
表2 显示了各知识追踪模型在四门课程上的AUC、ACC结果,通过对比可以看出,AKT模型在所有课程上的AUC和ACC值都是最高的,尤其在数据规模较大的临床中医药应用课程中也能保持良好的效果。这得益于三个原因,这三个原因来源于认知科学和心理测量学的经典理论。一是认为学习者在回答问题时理解和学习的方式取决于学习者,即对于两个具有不同过去历史记录的学习者来说,他们理解同一问题的方式以及从实践中获得的知识可能不同。基于这一观点,引入单调注意力机制对习题和回答进行表示,将学习者未来对习题的回答与他们过去的回答联系起来,能够捕获学习者上下文感知的知识状态。二是认为学习过程是时序的,伴随着记忆力的衰减,不相关知识点的作答和太久之前的作答与当前习题的作答相关性比较低。因而在计算单调注意力的权重时加入乘法指数衰减项,使得当前习题和过去习题的注意力权重不仅取决于两者之间的相似性,还取决于它们之间的相对时间步数。三是认为涵盖相同知识点的习题密切相关,但具有不容忽视的重要个体差异。因此使用心理测量学中经典的Rasch模型构建知识点和习题的表示,通过习题难度和学习者的能力来建模学习者正确作答习题的概率。
2.4 可视化分析
鉴于AKT模型在上述四门课程中均表现最佳,本研究对AKT模型的相关输出结果进行可视化分析。
1) 学生个体的知识状态追踪
选择计算机应用基础课程中某位学生的所有答题预测结果,将其对知识点掌握程度的变化过程进行可视化,结果如图3所示。用不同图案/颜色表示不同的知识点,圆点的大小表示预测答题正确的概率大小,圆点越大,表示预测正确的概率越大。从图中可以发现,知识点1、3、7对应的圆点没有变化,且圆点较大,说明该学生对相应知识点的掌握情况较好。知识点2、4、5对应的圆点开始时较大,中间变小,最后又恢复开始时较大的状态,说明该学生开始对相应知识点的掌握情况较好,考虑中途学习的遗忘因素,学生知识水平降低,但后续随着持续练习又恢复了最初的水平。知识点6对应的圆点开始时较小,后续圆点变大并保持较大的状态,表明该学生开始未掌握知识点6,随着练习的不断加强逐步掌握了知识点6。