基于大数据的在线课程教学数据分析与展示——以《平面设计》课程为例
作者: 毛烨 许建林
摘要:在教与学的过程中,教师、学生、学校以及家长等各方需要及时了解学生的学习情况,线上教学的开展使得教学数据更为丰富和客观。利用大数据技术来统计和分析这些教学数据,深挖相关数据之间的规律,以可视化图表的方式直观呈现,可以方便教师更及时、精准地调整教学策略与资源,这对提升教学质量、提升人才培养质量意义重大。
关键词:大数据;在线课程;教学数据分析;可视化
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2022)26-0050-04
随着国家“新基建”的深入开展和教学信息化的不断普及,不但推动了大数据、云计算、物联网、人工智能等新技术的发展,也更新了传统的教育教学观念,正在逐渐改变一些教育教学行为。特别是2021年7月,教育部等部门专门发布了《教育部等六部门关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》[1],要求“促进信息技术与教育教学的深度融合”“普及教育应用”“创新评价应用”“拓展研训应用”“深化管理应用”等。2020年初,为应对新冠肺炎疫情,几乎所有学校都开展“停课不停学”的在线教学。经过近2年的建设,各类网络教学平台已日渐完善,基本实现“从专用资源向大资源转变” [2],师生信息素养不断提高,相关课程也逐渐形成“线上与线下相结合”的教学模式,教师和学生的平台使用情况产生了丰富的在线教学数据和在线资源使用记录。然而如此海量的教学行为数据对学校决策、学生学习规划和老师教学方案制定都有重大作用,基于大数据的在线教学数据分析也愈发重要[3]。
论文以《平面设计》课程为例,采用各种大数据技术,对该课程的在线教学数据进行分析,并对结果进行可视化展示,以指导学生和教师调整学习与教学行为。
1 基于大数据的数据分析技术流程
基于大数据的数据分析与展示主要包括6个流程。技术流程图如图1所示:
(1) Hadoop平台部署安装。作为一个开源平台,用户可以在不了解Hadoop底层分布细节的情况下,开发分布式的程序,以充分利用廉价机器集群的运算速度和分布存储的数据。
(2) 数据采集。使用Python语言,辅以强大的软件工具包,编写爬虫脚本,自动解析网页,获取数据。采集的离线数据,输出保存到Hadoop的HDFS目录中。
(3) 数据清洗。使用MapReduce对HDFS中的数据进行预处理,将数据转换成便于统计和分析的相对结构化的数据。
(4) 数据分析。数据清洗后的仍在MapReduce中进行统计、分析,在HDFS中生成数据输出目录。
(5) 数据可视化。用Python+echarts来进行数据可视化展示,并在HTML页上呈现。
(6) 综合分析。结合数据分析和数据可视化结果,发现学生学习行为规律,及时让老师调整教学策略,提醒学生学习重点和难点,提升教学的效率。
2 大数据平台搭建
大数据平台搭建于VMware Workstation Pro上,选用Cent OS7作为系统,安装全分布Hadoop,其中一台为管理节点,其他四台为数据节点。 依次安装好JDK、Hadoop、Hive、Zookeeper、Hbase、Spark等软件。通过FileZilla上传至hadoop1目录下的ope中。
2.1 安装配置Centos系统
安装5台Centos系统。安装好后需修改主机名,设置静态IP和hosts,创建普通用户,配置好SSH。先安装cent os7系统,将主机名改为hadoop1修改命令:vim/etc/sysconfig/network,然后保存:wq。然后使用命令:cd/etc/sysconfig/network-scripts/ifcfg-eth33修改IP地址:172.16.1.41。如图2所示。
2.2 安装配置Hadoop
配置Hadoop{“hadoop.env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml,slaves”},共配置6个文件。
依次配置完上述6个文件后,将hadoop1复制到其他计算机,修改机器名为hadoop2 , hadoop3 , hadoop4 , hadoop5,最后输入命令hdfs namenode -format 进行格式化一下,在虚拟机hadoop1中进入目录/usr/local/src/hadoop-2.6.0/sbin/,输入start-all.sh,启动Hadoop集群。
2.3 安装配置其他软件
其余各软件的安装步骤与hadoop相类似,不再重复,安装路径及部署位置如表1所示:
3 数据分析与可视化展示
3.1 数据分析流程
基于大数据的在线课程教学数据分析流程如图3所示。在线教学平台的教学大数据经过预处理后,导入Hadoop平台进行处理并建立HBase数据表。最后经过Mapreduce清洗后得到最终用于可视化展示的数据。
3.2 在线教学数据结构化处理
为了对学生划分等级和教学重点规划,论文采集了江苏某高职学校2019级的计算机网络技术三个班的《平面设计》课程教学数据,一共获得109名学生的数据,将获取的数据导入组件Hadoop平台,按表2和表3的字段命名规则在HBase建立数据表,以对这部分学生数据进行分析。
3.3 数据分析与可视化展示
将预处理后的109名学生的在线学习平台数据存储到HBase中,使用大数据技术与数据查询技术提取学习者特征信息和章节特征信息,对学生进行学习行为统计和分析,将上课的学生成绩与教学任务相联系,以便科学建立学习者行为习惯、学习绩效及教学任务重难点之间的联系[4]。
3.3.1 教学平台活跃度
(1) 学生每日登录人数统计
通过MySQL查询学生登录信息表,来统计每天登录教学平台人数和平均每天登录平台的人数。
(3) 数据分析
一个时间周期内,教学平台登录人数在3月4日达到了顶峰,间隔一周后在3月10日又达到了高峰。根据授课计划,每周二和周三为上课的日期,学生会在上课前完成课前预习任务和课后任务。其余每个非周末的时间,也有将近半数的学生会登录平台,而登录人数较低的日期为周末。
3.3.2 学习登录次数与时长统计
(1) 学习登录次数、时长统计
通过建立0-24时全时段数据表来保存学生每次登录平台和离开平台时间,并通过关联查询来统计每个登录号十天内的累计学习时长。
(2) 可视化展示
(3) 数据分析
结合学生登录的次数,由可视化结果可以看出,10天内累积学习时长排名前10的同学,每天都会登录学习平台,并且每天在线时长约1小时,其学习成绩也均达到优良。
3.3.3 学生学习成绩等级划分
(1) 学生学习成绩等级划分
统计平台中90-100、80-89、70-79、60-69、0-59数据区间的人数。
(2) 可视化展示
(3) 数据分析
此部分统计的是学期末学生的总评学习成绩,图表中明显看出学生成绩基本呈正态分布,除了2名学生不及格外,其他学生均完成课程学习,到达合格要求,70%以上的学生期末成绩能达到良好及以上。
3.3.4 教学任务分析
(1) 教学任务平均得分
预设9个教学任务的权重,统计所有学生在每个教学任务的平均得分,得到每个教学任务的直观教学成果。
(2) 可视化展示
(3) 数据分析
此部分展示的是《平面设计》课程9个教学任务的学生平均得分,此中可以看出学生在AI基本编辑工具和图形编辑工具的使用上有所欠缺,特别是路径工具的掌握。
4 结果分析与建议
根据以上统计和可视化展示的结果,结合日常教学实际,可总结出以下规律和建议:
(1) 笔者所在学校,平均每天登录人数接近总人数的70%,尤其是在有课的当天,学生登录频次较高,学生在教师的引导下能利用平台开展学习。
新冠疫情爆发到现在,学生已经习惯开展线上与线下相结合的教学,线上教学在培养学生自主学习方面是有一定成效的。但教师也要强化以网络资源的建设,争取以内容吸引和留住学生,提供与课程内容配套的价值、质量、趣味性等均有较高质量的资源[5]。
(2) 学习成绩优良的学生,平均每日都能登录平台开展自主学习,学习成绩优良。说明花费在学习上的时间长度与学习成绩是成正比的。
教师应督促学生多利用教学平台开展学习,以提升学习主动性和教学效果。对于学习主动性较强的学生,教师要鼓励这部分学生坚持并持续自主学习[6]。而学习主动性较弱的学生,则要帮助他们树立正确的学习态度,加大学习监管,引导其主动转变学习观念。
(3) 每个教学任务的平均得分可以直观地看出学生哪些知识点有欠缺,也可以及时修正教师主观主义上认定的重难点、“优差生”及目标达成与否。
大数据分析的结果可以为教师科学地掌握重难点提供依据,修正主观主义的偏差,以及时调整教学策略和补充资源。针对不同学生群体,提供不同的指导与帮助,“因材施教”,最终提升教学质量和人才培养质量[7]。
参考文献:
[1]教育部.教育部等六部门关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见(教科信〔2021〕2号)[Z], 2021-07-08.
[2]教育部.教育部关于印发《教育信息化2.0行动计划》的通知(教技〔2018〕6号)[Z],2018-04-13.
[3] 陈新佩.智慧教育背景下学习大数据分析技术研究[J].电子元器件与信息技术,2020,4(9):57-58.
[4] 杨定中.基于教育大数据的数字化学习行为分析研究[J].教育教学论坛,2017(22):77-79.
[5] 赵磊,冯佳玉,高树仁.在线教育环境下大学生持续学习行为影响因素研究[J].黑龙江高教研究,2021,39(2):141-146.
[6] 陈琳,张序,杨丰宁,等.基于MOOC数据的民航专业课程学习中的行为特征分析及对策研究——以空中交通运输专业(飞行签派方向)本科学生“签派实践应用”课程为例[J].安阳工学院学报,2019,18(4):1-6.
[7] 毛烨,陈熔.大数据背景下高职课堂精准教学研究[J].科技视界,2020(32):112-115.
【通联编辑:王力】
收稿日期:2022-03-02
基金项目:2020年度江苏省教育厅高校哲学社会科学研究项目(2020SJA2158) ;2022年江苏农牧科技职业学院教科研立项课题(JYZX202201)
作者简介:毛烨(1983—) ,女,江苏泰州人,硕士,副教授,主要研究方向为高等职业教育,农业物联网技术;通信作者:许建林(1979—) ,男,江苏扬州人,硕士,副研究馆员,主要研究方向为情报学,农业物联网技术。