新工科背景下基于项目引导和线上线下联动的数据挖掘课程教学改革

作者: 王浩 贺钰昕 何志权 曹文明

新工科背景下基于项目引导和线上线下联动的数据挖掘课程教学改革0

摘 要:随着时代的发展与技术的进步,人们生产、收集、存储数据的能力越来越强,数据已经成为人们生产生活中必不可少的关键因素。而数据挖掘技术使得从海量的高维数据中挖掘出有用信息成为可能。目前越来越多的高校开设了数据挖掘课程。依据数据挖掘课程的自身特点和高校学生普遍存在的知识基础不牢、实践能力缺失等问题,本文依据新工科建设教育规范提出了一种新的基于实践项目牵引、线上线下联动的新型混合式教学改革方案。该方案对交叉学科教学和新型工科人才培养进行了探索,也为其他相似课程的教学改革提供了可借鉴的改革方案。

关键词: 数据挖掘; 教学改革; 项目牵引;新工科建设; 混合式教学

中图分类号:G424        文献标识码:A

文章编号:1009-3044(2022)09-0178-03

开放科学(资源服务)标识码(OSID):<E:\2022知网文件\8-9\9\8xs202109\Image\image1_12.jpeg>

1  引言

教育部推出的“新工科”计划是应对新时代科技和产业变革的重要措施,为我国高校的工科教育改革发展指明了方向。“新工科”计划要求工科教育应从原有的学科导向产业需求导向变更[1],人才培养目标也应从原本的细分专业人才向跨界交叉融合的多元化创新型人才转变[2]。因此我们必须不断探索新的工科课程教学模式,改革教学方法以适应新时代对工科人才培养的新需求。

随着互联网、数据传输、数据存储、云计算等技术的发展,人类产生的数据量以指数形式快速上升。依据国际权威机构Statista的统计和预测,2009年全球数据产量不足1ZB, 2020年全球数据产量达到47ZB,而2035年这一数字预计将达到2142ZB。而且随着数据科学和相关技术的发展,数据在人们生产、生活中的地位愈发重要,目前数据已成为重要的生产资料和战略资源。

一般而言,大数据具有价值高、体量大、数据形式多种多样、变化频繁快速等特点。这里大数据本身拥有的高价值是数据挖掘工作出现的原因。而其自身的大体量、多样化、变化快等特点使得数据挖掘工作面临大量的问题和难点。克服这些困难需要综合运用统计学、数据库、高性能计算、机器学习算法等多个方面的知识,并且在这些学科和知识的基础上不断丰富逐渐形成了数据挖掘技术。

数据挖掘技术可以基于数据完成目标分类、回归预测、聚类分析、关联分析、异常检测五大任务。而且目前数据挖掘技术已经在广泛应用于电子商务、数字金融、工业生产、生物医疗、政策制定、社会研究等众多应用领域中[3]。因此,数据挖掘是一门发展前景和应用范围都非常广阔的专业课程。目前全国越来越多的高校已经为本科生开设了数据挖掘课程。

2  课程特点和问题分析

大数据的自身特点使数据挖掘成为一门涉及统计学、机器学习、人工智能、高性能计算、数据可视化等多个方向的交叉学科。数据挖掘课程包含的学科内容覆盖广,知识点多。这样如果采用传统课堂讲授的方式来进行数据挖掘课程教学,这可能导致:1)课堂讲授时间有限,教师无法全面覆盖本课程的所有关键知识,导致学生学习的知识不成体系;2)教师为尽可能地覆盖全部知识点,就只能对大量知识点进行简单介绍,无法深入探究;3)作为应用性与实践性较强的课程,传统课堂教学对学生的动手能力、实践能力的培养不足[4-5]。

课程涉及的数学理论多且对本科生而言比较复杂。若将相关数学知识放在课上讲解,这可能拖慢课程节奏;但若交给同学课下自学相关数学知识,一方面这样对于相关知识的理解和学习不够具有针对性,另一方面也可能由于学生对相关数学原理认识不足导致其无法充分理解授课内容。

作为一门应对数据时代高速发展的专业课程,数据挖掘所覆盖的课程内容更新迅速且频繁。传统教学方式和相关教材难以紧跟产业前沿做到快速更新迭代。因此,直接使用基于某种教材的课堂教学方式难以紧跟产业发展前沿。这样学生所学习的相关知识很可能相较于产业实践滞后若干年,这不利达成新工科要求的人才培养目标。

与一般性课程不同,数据挖掘课程实践性极强,对学生的实践能力动手能力要求较高。传统作业和考试相结合的考核方式无法与课程自身特点有效契合,不利于培养学生的数据思维和实践能力。而且前期调研表明目前大部分学生是以应对考试、提升考核成绩为目的学习本课程的,这会严重影响课程的传授效果。因此在课程改革中应从课程设置、考核方式等多个方面着力培养学生的实践动手能力。

最后,相较于其他学科,本课程不仅需要传授相关学科知识,更重要的是要培养学生对待数据的严谨性,养成理解数据、分析数据、使用数据的思维方式,同时提升学生的数据挖掘的能力。这些目标都很难基于传统授课形式达成。

3  课程设计与改革方案

3.1 课程改革思路

依据上述传统教学方式在数据挖掘课程中遇到的问题,本文提出了如下课改思路:

(1)构建两棵知识树

授课前授课教师需要依据课程内容与行业发展情况构建并更新本课程的知识树。这里知识树的构建采用思维导图的形式,大体上依照任务、算法、原理、数学工具、其他相关理论知识逐层拆解。知识树的构建原则是:1)尽可能完全地覆盖本课程的所有知识点以及与这些知识点相关的数学原理和其他相关知识;2)尽可能地将知识点进行细分,对于每个独立知识点的讲解采用网课形式,尽量确保知识树上每个节点内包含的知识可以在时长为10到15分钟的网课中介绍清楚。3)知识树整体结构务必清晰,能够引导学生按照从根节点到叶子节点的顺序展开学习。4)分类树尽头的叶子结点必须是对于本门课程内无法再分的学科知识或数学原理,学生可通过完成考核的方式跳过对叶子结点的学习。以SVM算法为例,数据挖掘课程的知识树构造如图1所示。在图1中每个节点都对应一段10到15分钟的网课教学视频,节点之间的连接反映了知识点之间的关联关系。这样构建知识树的好处主要有6点:1)利用线上网课的方式辅助课堂教学;2)将知识拆分成点帮助学生利用碎片化的时间完成学习;3)能够更好地适应数据挖掘作为交叉学科,自身内容覆盖广,涉及的数学理论多等特点;4)学生可以依据自身情况有侧重地学习知识;5)教师可以对每个知识节点给出适量的测试题目,通过线上测试直观地把握学生对各个知识点的掌握情况;6)学生按照从根节点到叶子节点的顺序展开学习,尽可能地避免了知识的割裂。

第二棵知识树是由学生构建的。学生通过网课教学和线下课堂两种方式共同完成知识树的学习。而在最终考核阶段,我们会要求学生依据自身对课程内容的理解,按照思维导图的形式构建成对课程构建一个完整的知识树,并完善补全知识树中各个节点之间的关联关系。最终教师可依据学生构建的知识树来评估学生对于课程内容的整体掌握情况。

(2)课程知识从实践中来到实践中去

从实践中来是指本课程第一节课会邀请业内相关技术人员或专家前来讲座。具体来说授课教师需要邀请专家前来帮助完成如下三项工作:1)从实际项目出发,阐述数据挖掘技术在企业界的具体使用情况,以激发同学们的学习兴趣;2)邀请专家依据产业经验和发展情况对课程知识树进行补充和完善;3)邀请专家提供与行业密切相关的数据挖掘实践项目。到实践中去是指本课程的实践项目将贯穿课程始末,并将最终的项目成果作为考查学生学习情况的重要指标。这样做的不仅能够加深学生的实践能力,而且可以帮助学生更好地理解课程相关知识。

(3) 线上测试与线下项目实战结合的考核方式

基于数据挖掘项目导引和网课技术,本课程设计了一种新的方式来考查学生对知识的掌握情况。具体来说每节课开始前会对下节课的课程知识点以及相关的数学理论基础进行线上测试。这样在一定程度上解决了学生数学基础参差不齐的问题;其次可以使教师更好地把握学生对课堂内容的掌握情况,进而能够在课上更有侧重地讲解知识难点;此外还可以督促学生提前预习,提升学习效果。

而每节课结束当晚,我们都要求学生对课上所学内容进行线上检测。且该检测结果将记入平时成绩。这样做对教师而言可以查漏补缺找到学生没有充分掌握的知识盲点,也可以督促学生复习回顾课堂内容进一步提升课堂教学效果。

3.2 课程改革具体流程

具体来说本文提出的新型授课流程如下:

(1)在课程准备期

教师依据课程内容构建知识树。针对各个细分知识点进行相关资料准备和网课录制。对知识点进行出题,以便于在课程进行中完成对学生的线上考核。

(2)在课程初期

第一节课会邀请业内相关技术人员或专家前来讲座,帮助教师激发学生对课程的学习热情,补全删改知识树以做到课程内容与时俱进。

授课教师依据目标分类、回归预测、聚类分析、关联分析、异常检测这五大任务从数据分析竞赛平台kaggle(https://www.kaggle.com)和行业专家处选择项目构建项目库,并从项目库中为五大任务各选择一个与之对应的数据挖掘项目。最后要求同学在第二节课开始前,至少选择确认其中一个项目作为自己的实践考核项目。

(3)每节课上课前

课前5天将课程内容和不包含具体内容的留白型幻灯片(即不在幻灯片上完整的展示所有内容,只给出内容的主体框架)通过线上课堂分享给同学。同学需要依据课程内容进行网课学习,并总结学习过程中遇到的问题。

学生需在上课前一天完成线上测试。测试结果将基于线上课堂于上课前一天发送给授课教师。这可以帮助授课教师确定学生的数学基础和预习后对的知识掌握情况,在课前依据学生的具体情况调整课程重点和课程难度。此外课前考核的打卡情况将记入学生平时成绩。

(4)每节课上课时

授课教师依据课程知识树,将本节课所涉及的主要知识点依据课程自身层次结构进行10到15分钟的讲解。这样做主要是为了让学生将网课学习的内容贯穿在一起,形成知识框架,避免由于短视频网课导致的学生所学知识不成体系、各自分离的情况。

主要知识讲解后,将学生结成小组,对课前学习过程中遇到的问题进行10分钟左右的讨论。并且各小组需要将讨论后仍无法解答的问题进行总结提炼。

教师对各小组的问题进行作答和并依据问题对相关重点知识进行讲解。

课堂教学结束前,授课教师需要总结相应知识并重点阐述这些知识点如何在具体项目中落地使用。

(5)每节课课后

课程结束当晚组织学生进行线上课业考核,考核结果记入平时成绩。随后学生将本节课所学内容融入项目实践中,动手实操检测不同算法模型的具体效果。

(6)学期末

要求同学在学期末完成对应项目,将解决方案上传至kaggle上进行排名,并撰写项目报告。要求同学画思维导图(知识树)总结本门课程的知识点,帮助同学对课程内容进行梳理。

(7)考核

依据学生课前内容学习的打卡情况、每节课后的线上测试的成绩、课程知识树的构建情况、项目的完成情况综合评定学生成绩。

上述针对数据挖掘课程的改革方案以项目实践贯穿始终来提升学生的实践动手能力,以线上线下结合互补的教学方式来提升效率解决课程内容广、知识点多的问题,以打卡、测试、加项目的形式综合评定学生成绩来改变学生唯成绩论、唯考点论的学习作风。课堂实践表明,本方案可以很好地激发同学们的学习兴趣、加强学生的学科知识的理解,并提升学生的实践动手能力。本项目对其他交叉融合学科的教学改革具有重要的参考意义。

4 结论

随着科学、技术、经济、社会的高速发展,数据已经成为人们成为重要的生产资料和战略资源。因此,数据挖掘技术变得愈发重要。数据挖掘已经成为新工科背景下,计算机和电子工程类专业人才培养的重要专业课程。与其他传统专业课程相比,数据挖掘课程属于交叉学科,内容覆盖广、知识点多、更新快、涉及的基础理论杂,且课程实践性较强。鉴于上述课程特点和新工科背景下人才培养的要求,本文提出了一种新的基于实践项目引导、网课辅助、线上线下联动的新型混合式教学方案。该方案为交叉学科教学和新工科背景下复合应用型人才的培养进行了有益的探索,为其他相似课程的教育改革提供了可借鉴的新模式。

参考文献:

[1] 钟登华.新工科建设的内涵与行动[J].高等工程教育研究,2017(3):1-6.

[2] 姜晓坤,朱泓,李志义.新工科人才培养新模式[J].高教发展与评估,2018,34(2):17-24,103.

[3] 丁毅涛.大数据时代下的数据挖掘课程改革探索[J].科技风,2021(27):27-29.

[4] 谭征,孙红霞,王立宏,等.基于实例的本科数据挖掘课程教学探索[J].计算机教育,2013(9):67-70.

[5] 黄岚.数据挖掘课程实践教学资源库建设[J].计算机教育,2014(12):89-92.

【通联编辑:闻翔军】

上一篇 点击页面呼出菜单 下一篇