基于大数据技术的高职学生画像构建与应用

作者: 毛烨 许建林

基于大数据技术的高职学生画像构建与应用0

摘要:高职院校的一体化平台集聚了学生相关的海量数据,为构建高职学生画像提供了数据基础。基于大数据技术构建的学生个体画像和群体画像,可以用来分析学生行为、开展精准辅助和学习/行为预警,有助于实现高职教育教学的个性化、精准化和学校管理的主动化、科学化,进而提升人才培养质量。

关键词:大数据;高职;学生画像;学生行为分析;精准辅助;预警

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2025)04-0099-04 开放科学(资源服务) 标识码(OSID) :

0 引言

随着教育数字化转型,大数据技术为高职教育带来了机遇与挑战,并逐步应用于学生画像构建。2022 年,国家层面又启动教育数字化战略行动,党的二十大也首次将“推进教育数字化”写入报告。以“人工智能”“大数据”“物联网”“云计算”等为代表的现代信息技术也不断融入社会、融入生活,成为推动教育数字化、现代化的重要手段。当前,依托智慧教学平台和学生管理平台的广泛应用,学生日常学习、生活、娱乐的数据得以完整的记录和保存。

目前来看,各个高职院校均已意识到要充分利用这些校园大数据,但在使用时仍然存在数据思维淡漠、数据维度单一、应用场景有限等问题。

因此,运用数据思维和大数据技术全面开展高职教育的“依数治理”,可以不断提升教学质量、提高管理效率,从而提升人才培养质量。

1 大数据技术与学生画像

1.1 大数据技术

大数据技术是指综合运用各种现代信息技术和方法,从具有5V特征(即数据量大(Volume) 、处理速度高(Velocity) 、数据种类多(Variety) 、价值密度低(Value) 和具有真实性(Veracity)) 的数据中发现、提取有价值规律的操作总结和技术规范。大数据的核心技术包括数据采集、数据预处理、数据挖掘与分析、数据可视化等。

1.2 用户画像

“用户画像”的概念最早由Alan Cooper提出。他认为,“用户画像”是通过对真实用户的数据分析,用数据建立的虚拟目标用户模型。用户画像侧重从不同维度归结同一类用户,刻画用户的广义特征,并基于这些特征精准推荐产品或服务,实现将用户数据转化为产品价值[1]。

1.3 学生画像

高职院校智慧教育平台或一体化教育平台的建立,为记录高职学生学习、生活等各种数据的采集提供了硬件和软件基础。学生画像是利用大数据技术,对学生的学习行为、兴趣爱好、心理特征等进行多维度分析,构建的个性化学生模型,用于辅助教育教学决策。

2 高职学生画像构建

高职学生画像构建侧重利用大数据技术,采集每一位学生学业评价、行为轨迹、社交数据等,挖掘出学生学习行为、人文素养、社交属性、兴趣爱好、心理特征、思想品德等,建立开放、完整、动态、可视化标签体系,从而组合出事实的、具体的、立体的高职学生个体画像和群体,用于分析学生行为、开展精准辅助和预警,以实现个性化教育和科学化管理。

本文根据学校管理需要,将学生画像分为个人画像和群体画像。个人画像面向个体学生,用于辅助辅导员(班主任) 、授课教师等快速了解学生个体的特点,以开展学情分析和精准教学活动。群体画像是按标签筛选后的个人画像集合,用于辅助学校各级管理人员分析特定学生群体特征,以进行情况研判、决策辅助等。

2.1 学生画像构建步骤

构建学生画像的大数据来源是日益信息化、电子化和数据化完善的各类系统。本文使用“数据-标签- 画像”二级映射的方法构建学生画像。首先,采集学生数据并进行预处理;其次,根据数据特征建立标签体系,并对数据进行打标签;最后,基于标签数据构建学生画像。

高职院校学生画像的创建从流程上分为4步:基础数据采集与整理、建立标签体系、构建学生画像、学生画像的展示与应用。如图1所示。

2.2 基础数据采集与处理

2.2.1 数据采集

学生画像的基础数据主要采集于智慧校园平台,可以采用网络爬虫、API接口等方式,从智慧校园平台、教务系统、学生管理系统等多个数据源采集数据,包括校园网访问记录(访问模块类型、评论数量、发布讨论数量等) 、教务系统中教学与行为数据(学生的基本信息、学习评价、作业评价、在线平台访问记录与互动记录等) 、学生管理系统中的行为数据(出入宿舍时间、奖惩记录、校园消费记录、受资助记录、社会实践记录等) 、图书管理系统中的行为数据(借阅记录、在馆时间等) 以及教学一体化平台中日常采集的上课视频和音频等信息。

主要数据分类如表1所示。

2.2.2 数据处理

通过上述各个系统采集的高职学生数据既有结构化的,也有非结构化的(特别是课堂音视频) ,都需要进行数据预处理,为后续的操作做好准备。数据预处理的第一步是进行数据清洗,提高数据的质量。第二步进行数据变换,将有关学生的不同系统采集的数据,按统一标准转换成合适的结构化数据形式。该步骤中,要注意对数据信息进行归一化处理,使每一个数据对整体的贡献大体得当。例如:学业成绩有百分制和等级制,受资助情况则以百元或千元计,数量级的不一致,会导致后续相应标签对画像贡献度的巨大差异,也就无法得到最终真实的学生画像。第三步是数据集成,将采集于多个系统的结构化数据进行数据复制和模式集成,如使用Sqoop 导入HDFS 或编写Spark语句连接传统数据库,合并数据量,形成统一的数据仓库[2]。

2.3 标签体系构建

本文采用基于学生维度(也就是基于用户维度) 来建立标签体系。通过上述的数据采集与处理,可以进一步提炼得出对学生的高度精炼概括的特征描述,也就是标签。最后综合所有关于学生的标签,便是学生标签体系[3]。

对学生打标签分为基于事实类的标签、基于统计类的标签、基于规则类的标签和基于大数据分析的标签。不同标签相互关系如图2所示。

2.3.1 标签概述

1) 基于事实类的标签。基于事实类的标签主要是一些关于学生基本属性和既成事实的数据或内容,如对于某个学生来说,他的姓名、身份证号、性别、年龄、受资助信息等,只需要从学工系统的学生基本信息表中直接提取就能获得。这类标签是学生画像的基础之一。

2) 基于统计类的标签。基于统计类的标签主要是以智慧一体化平台中的事实数据为来源,对指定主题的数据进行各类统计,经过简单计算后得到的标签。如通过对学生进出图书馆的时间进行计算可得到学生在馆时长、对学生每个月一卡通消费记录进行计算可得到学生的月平均生活费金额等。这类标签也是学生画像的基础之一。

3) 基于规则类的标签。基于规则类的标签主要是基于基本事实和数据无法直接得出的标签,需要设置确定的规则,结合学生行为数据而产生。如将“学业欠佳”学生这一说法定义为“每学期挂科门数>5且学期平均学分<5”。这类规则在学生画像的构建过程中,因一线任课教师和辅导员对教学业务更加熟悉,所以在规则类标签的规则确定过程中,需要他们的参与,共同协调制定。

4) 基于大数据分析的标签。基于大数据分析的标签,主要通过各类大数据算法对事实数据和统计数据进行计算、分析后得到的标签,可用于对学生的某些行为或属性进行预测和判断。如打上“学业欠佳”规则类标签的学生,可使用关联算法和聚类算法,来推测学生未来挂科的可能性、挂科的课程名称以及是否提示学业预警进行预测。

2.3.2 标签体系的确定

依据学生的基础数据和对学生全面评价的要求,本文以学生相关事实数据基础,从5个维度(基本信息、社交属性、学业水平、人文素养和身心健康) 出发,逐级抽象、整合为学生画像的标签体系[4],具体如图3 所示。图

2.4 学生画像构建与展示

在确定学生画像多维度标签体系后,采用基于规则的推理、协同过滤、聚类分析等不同算法,对高职学生数据进行多维度的建模,最终构建精准的学生画像。在具体构建过程中,可以分为学生个体画像构建和学生群体画像两大类。

2.4.1 学生个体画像

按照一体化平台中导出并规范化相关数据,以学生个体为中心,基于个体的差异,对照标签体系中的内容逐一进行填充,就可以得到一个多维度、立体且全面的学生画像,如图4和图5所示。

2.4.2 学生群体画像

学生群体画像的构建其实是一项数据挖掘工作,该工作以具有相同特点的学生为中心,基于群体的相似性,对一体化平台中的元数据进行各种机器学习、关联算法、聚类算法等分析,来挖掘具有同类特征或潜在同类特征的学生,进而按要求生成多个学生群体画像。

例如,按学生的年级(大一) 、所在学院(动物医学院) 和阅读偏好等标签来对学生进行聚类分析,可以得到如6和图7所示的学生群体画像词云图。当然,标签设置越细化,得到的群体越精准。

2.5 学生画像的应用

2.5.1 学生行为分析

通过大数据构建的高职学生个体画像,辅导员、任课教师、学生和学校其他管理人员都可以直观而精准地对学生个体进行全面了解。从最基本的上课出勤、学业评价、作业完成到一卡通消费、归寝时间、图书借阅数量等,不仅校方人员可分析学生的学习/生活行为轨迹,识别学生的学习/生活风格,为其推荐个性化学习资源,引导学生心理和生活动向。也可以让学生更清晰地反观自己某一阶段的学习/生活状态,以主动调整,回归最佳。

学生群体画像则可以按特征标签筛选同类特质学生,有利于校方了解不同学生群体之间的行为表现差异,设定差异化的教学目标或培育目标,开展分层分类教育,提升教育管理的精准性。

2.5.2 综合精准辅助

综合精准辅助包括精准助学和精准资助。大数据支撑下的学生个体画像让辅导员和任课教师对每个学生都能有精准的认识,从而根据每个学生的特点或者群体学生的特点采取不同的方法,精准施策,因材施教,提供精准的学业指导、职业规划和心理咨询服务。

精准资助是指精准资助家庭经济有困难的学生。通过一卡通消费的大数据后,学生在校园内消费的金额总计和频次分布一目了然。与学校整体情况相比,不用申请,也能判定或辅助判定学生家庭经济是否困难,避免学生因各种原因没有申请或未能成功申请到助学金的情况,还可以定向向这部分学生推送勤工俭学岗位信息或兼职信息。

2.5.3 学业/行为预警

高职院校的学生相对来源广泛,个性突出,素质参差不齐,主要依赖辅导员或相关老师的经验,预判或被动式处理学生的异常状况,不能高可靠性、主动地对学生可能发生的异常行为或潜在不良结果进行提前干预。而有了大数据支撑的学生画像,就可以及时利用学生的学业评价、出勤记录、进出校园记录、校园网使用记录等信息,进行聚类分析或关联分析,设置预警阈值,及时、主动地针对学生的学业/行为进行预警提示,提前告知学生继续当前状态可能会产生的不良后果及处分提醒,以警代罚,实现学生管理的主动化和人性化[5]。

3 结论

构建基于大数据技术的高职学生画像,是海量学生数据在高职学校的深入、全面应用。学生画像不仅以可视化的方式呈现学生个体和学生群体的信息,还能帮助校方人员树立数据思维,看清、理解大数据背后的“真相”,及时调整教育、教学、管理活动,开展个性化、精准化、主动化、提前化的指导和干预,提升高职院校学生培养的质量。

参考文献:

[1] 王旭红,张彤,申志华.大数据环境下开放教育学习者画像的构建[J].电脑知识和技术,2023(5):78-80.

[2] 陈会,余馨,李琳琳,等.基于大数据技术的大学生学习画像构建[J].软件工程,2021,24(3):36-38.

[3] 茹兴旺,王霞,关金金.基于大数据维度视角下高校学习者精准行为画像的构建与应用[J].科技视界,2022(31):147-149.

[4] 励凌凌,孙澄宇.基于大数据的职业院校学生画像系统构建[J].职教通讯,2023,38(2):79-86.

[5] 邱春华.大数据视域下高职院校学生群体画像建构及预警机制研究[J].湖北开放职业学院学报,2022,35(19):48-50.

【通联编辑:王力】

基金项目:2022 年江苏农牧科技职业学院“课程思政”专项课程建设立项项目(图形图像处理) (KCSZ20220628) ;2020 年度江苏省教育厅高校哲学社会科学研究项目(2020SJA2158) ;2022 年江苏农牧科技职业学院教科研立项课题(JYZX202201) ;2023 年江苏农牧科技职业学院学生创新创业培育项目(CXCYPY202325)

经典小说推荐

杂志订阅