数据分析与挖掘课程教学改革研究

作者: 蔡赛华

摘要:数据分析与挖掘是智能科学与技术专业的必修课,然而现阶段该课程教学中还存在诸多问题亟待解决。文章从现有问题出发,从树立“教师引导、学生主导”的课堂教学理念、制定多元化且紧跟实际案例的教学内容、科研融入教学实践、引入研究生“头脑风暴”式的培养模式以及建立健全考核评价机制等方面探讨如何改革数据分析与挖掘课程,以期提升学生汲取知识的自主性以及课堂教学效果,最终培养学生具有灵活地运用课程知识解决实际问题的能力。

关键词:数据分析与挖掘;教学改革;教学实践

中图分类号:G642      文献标识码:A

文章编号:1009-3044(2022)31-0178-03

随着人工智能、机器学习、云计算、物联网等新技术广泛地应用到社会生活的各个领域,近些年数据的规模呈现出指数型增长的趋势。在如今这个大数据时代,数据已经变成一种十分珍贵的资源,因此如何运用计算机技术从如此大规模的数据中挖掘和分析数据中隐含的规律以持续指导后续的生产和生活,已经受到全社会的重点关注。近些年,社会对数据分析和数据挖掘专业人才的需求与日俱增,这也促使数据分析和挖掘这门课成为培养数据分析人才的重要课程,它也成为智能科学与技术专业的必修课。数据分析和挖掘是一门涉及包括:数据库、机器学习、统计学、深度学习、模式识别等技术的多学科交叉课程,这也对教师实施教学过程以及学生学习知识的进程提出了更进一步的要求。然而,目前对于数据分析与挖掘这门课程的教学还存在如重理论轻实践、课程实践案例比较陈旧等问题,而这些问题的存在使得这门课程的教学内容无法与时代的发展相适应[1]。因此,探索如何更新数据分析与挖掘的教学理念、教学内容和实施方法、如何建立完善的数据分析与挖掘教学方法、如何在实践教学中融入现实生活案例以适应社会需求,具有重要的现实意义[2]。

1 数据分析与挖掘教学现状

数据分析与挖掘这门课程是面向江苏大学计算机科学与通信工程学院智能科学与技术专业学生开设的一门专业必修课,该课程共安排32学时(其中20学时授课、12学时实验)。由于学习该课程需要的先修课程数量较多、课程的理论难度较大、课程对实验要求较高,因此教学任务比较重且对学生的能力有了更高的要求[3-4]。然而,在这门课程实施阶段发现还存在如下教学现状。

1.1 学生对先修课程的掌握程度差异大

数据分析与挖掘课程内容中各环节涉及的知识点与先修课程有较强的联系,如数据存储用到的数据库技术、数据分析用到的统计学原理、数据挖掘用到的机器学习算法等,与课程相关联的先修课程比较多且理论深度、学习难度大,这也使得想学好这门课程必须掌握先修课程中的技术和原理[5]。然而,通过课堂的教学发现学生对较多先修课程知识点的掌握上存在一定的差距,而在程序设计基础的差异也使得学生在数据挖掘算法编写阶段出现进度不一的问题。此外,由于数据分析所涉及的知识点中有很大一部分是复杂的数学推导公式(如分类算法SVM的理论是基于数学分析中的拉格朗日乘子法进行大量参数的求解,需要很强的数学功底),因此对高等数学掌握程度不好的学生带来很大的困扰。这些问题的存在使得学生对学好数据分析与挖掘这门课产生怀疑;同时,由于学生对先修课程知识点的掌握程度不同,因此如何开展数据分析与挖掘这门课的教学以及让学生更深入地理解课程知识点相对比较困难。

1.2 教学方式枯燥且教学资源有限

智能科学与技术专业的学生在选修数据分析与挖掘课程前已经修完Python程序设计课程,已经较为熟练地掌握通过调取Python包进行数据处理,但是学生对所调用的Python包中涉及的具体算法的原理并不明白。而数据分析与挖掘课程中的很多数据挖掘和数据分析算法比较复杂且需要进行大量的公式推导,如:数据降维中的主成分分析算法(PCA) 需要借助高等数学中的拉格朗日中值定理进行推导。这种理论课所教授的内容是数据挖掘算法和原理的引入及推导,教学方式往往比较枯燥,缺乏更为多样化的教学形式,因此不易引起学生的兴趣,从而无法调动其学习积极性[6]。而实验环节主要通过实现相应数据挖掘算法以完成教学任务,没有很好地融入团队协作的方式,无法充分调动学生对实现算法的热情。此外,现阶段授课的内容主要集中在教材中的知识点,而教材中涉及的机器学习算法大多是经典的算法,无法有效地处理维度高、类型复杂的大规模数据,同时网上的教学资源也没有很好地对现阶段效果更好的机器学习算法进行系统的梳理,因此很难利用现有的教学资源更好地向学生呈现数据分析与挖掘这门课程。

1.3 实验课程中的算法比较陈旧

在实验教学过程中,教师所布置的实验内容大多是复现理论课堂中讲述的算法,往往需要通过对算法的复现判断学生对理论的掌握程度。然而,这种实验课程形式完全脱离了实际应用场景,无法让学生真正了解目前社会所使用的前沿技术,导致实验教学与实际生活相脱节[7]。如实验课程中的分类算法实现往往会让学生复现一些机器学习算法,如:ID3、C4.5和CART三种决策树算法、K最近邻算法等,而最近几年流行的深度学习模型虽然能够得到更好的分类效果,但是很少会让学生在实验课中进行复现。这种形式也会让学生对理论知识的理解只是停留在表面,而无法更深层次地明白算法背后所蕴含的思想。此外,现阶段实验教学中所使用的数据集的规模比较小、维度比较低、类型比较单一,这也与实际情况出现较大的差异。虽然复现的算法能在书本中提供的数据集上顺利地运行起来,但一旦遇到实际生活中的大规模高维数据时会因为算法陈旧而出现效率低甚至无法运行的问题。

1.4 考核评价体系不合理

现阶段对数据分析与挖掘课程的考察形式是闭卷考试,这种考察形式以学生对教材中涉及的算法原理以及知识点的掌握程度所呈现的笔试成绩作为最终的评价指标[8]。然而,这种考察形式缺乏对学习过程的有效评价,没有考虑到学生的个性化需求,未将学生的实践能力、综合能力等纳入考核评价范围,因此无法有效地考查学生在各个学习阶段的状态。这种考核评价体系的存在很难有效地提高学生运用数据进行分析和挖掘的能力,也很难提高学生学习的积极性和主动性。

2 数据分析与挖掘课程改革措施

为了解决现阶段数据分析与挖掘课程中出现的诸多问题,可以通过以下一些改革措施来更好地为智能科学与技术专业的学生呈现更为完善的课堂体验。

2.1 树立“教师引导、学生主导”的课堂教学理念

转变传统的“填鸭式”“教师一言堂”的教学模式,在课堂教学中教师要以学生为主体,树立“以学生为中心”的教学理念,能够正确地认识到在课堂教学中“教师为引导,学生为主导”的位置。在教学过程中,可以以小组合作的形式展开,以学生需求为导向,驱动课堂教学,把生活中的实际问题带入课堂,促进学生之间的讨论,通过小组讨论、发散思维的方式让学生深入教学重难点,梳理存在的问题并进行分析;然后派小组代表进行发言交流,教师就学生的发言进行点评并总结。这种形式不仅能让学生集思广益、自主学习并切身感受到自己在课堂中的重要性,还能让学生成为课堂的主导者,充分调动学生参与课堂教学与学习的积极性,提高其学习的兴趣;此外,也能增强学生团队协作意识与凝聚力,培养学生形成创新思维以及养成解决问题的能力。

2.2 制定多元化且紧跟实际案例的教学内容

在教学过程中,紧跟目前工业界和学术界使用的最新技术,通过整理和吸收国内外不断更新的教学资源,尤其是翻译和整理最新发表的英文学术论文,并结合智能科学与技术专业学生的学情,了解学生对这门课程的实际需求,对课程知识点、教学案例、课程实验内容等进行深层次的考虑,从而设计出更为多元化、更强适用性且紧跟实际案例的教学实践大纲,制定出更为合理、有针对性的教学策略。此外,紧紧把握现实生活中的实际需求以及行业中运用的先进技术,从数据分析与挖掘课程中涉及的知识点(包括章节中的重、难点)出发设计具备典型性、前沿性和整体性特征的应用案例,通过融入课程知识点对实际案例的解决过程进行讲解以突出课程各章节中的重难点,并从整体出发设计教学计划以绘制完整的课程知识脉络,从而为后续顺利地串联知识点奠定基础。而在后续教学过程中,以实际案例为导向,牢牢围绕设计的教学内容,通过介绍实际需求以让学生带着问题进行课程学习,通过对如何解决现实生活中的实际案例进行详细的分析引出课程知识点,并结合最新的技术教案带领学生一起学习知识点中的重难点,从而让学生更好地掌握数据分析与挖掘这门课程的教学内容。

2.3 科研融入教学实践

如今深度学习、机器学习等技术得到了不断的发展和更新,也出现了很多新的技术和方法,但是现有教材中的知识点比较陈旧,利用这些技术无法有效地处理呈现爆炸式增长趋势的大规模数据。因此,将日常的科研工作深入地融入数据分析与挖掘课程教学实践中的各个环节,是课程改革的一大突破。科研融入教学实践能有效地提高对学生授课的质量,增进师生间的交流互动,进一步提升师生之间的双向能力。更具体地,可以把科研中的一些子问题引入课程教学过程中,引导学生思考如何改进一些数据分析或数据挖掘算法以提升对数据处理的效率,从而在学好数据分析与挖掘课程的基础上更深入地思考如何利用数据分析或数据挖掘算法解决现实生活中的一些实际问题。通过将科研融入教学实践中,可以更有效地将科学研究与理论学习、技术培养与教学实践相结合,从而建立一种更为有效的教学实践方式。

2.4 引入研究生“头脑风暴”式的培养模式

在教学过程中,一个最直观的感受是课堂中学生往往很少举手对课程中所涉及的知识点进行提问,而且随着年级越高提问的人数呈现出下降的趋势。这一现象出现的一个主要原因是现有的教学模式已经把学生养成了只求分数而忽视知识内涵的习惯。与之相反,研究生培养过程中组会已经成为一种知识交流的主要阵地,而组会往往以一种“头脑风暴”的形式开展,这种方式不仅有效地促进了知识的传播,而且也能让学生从自身所掌握的知识体系出发主动与当前学习的知识进行主动融合,从而更好地对某个知识点进行延展。适当地在数据分析与挖掘课程中引入研究生“头脑风暴”的培养模式,可以有效地促进学生对课堂知识点的理解与反思,从而更好地学好这门课程。

2.5 建立健全考核评价机制

彻底变更传统的以最终考试成绩为衡量标准的片面的考核评价体系,运用信息化技术手段监测学生课前知识点预习、课后单元测试以及课后作业作答等情况;同时,在课堂中借助“MOOC”“雨课堂”等网络教育平台实施课堂签到、问题回答、问题讨论等环节;此外,还组织学生以小组为单位进行汇报,通过这些打分环节的综合考虑利用综合评价法对每个学生的教学过程进行评价。通过多角度、全方位的考核和评价给出学生的最终评分,既能有效地对教学实施过程进行评价,也能给学生更多的课程体验。

3 结束语

在现如今这个大数据时代,数据已经成为日常生产和生活中宝贵的财富,对数据进行分析和挖掘可以发现数据中隐含的规律。与其他计算机课程不同的是,数据分析与挖掘这门课程实用性很强且贯穿到各个行业领域,因此它已经成为计算机专业的主干课程。然而,现阶段在教学过程中依然出现学生先修课程掌握程度差异大、教学方式枯燥且教学资源有限、实验课程中的算法比较陈旧以及考核评价体系不完善等问题。本文针对目前数据分析与挖掘课程的教学现状和存在问题,探索了数据分析与挖掘课程教学改革策略,提出了树立“教师引导、学生主导”的课堂教学理念、制定多元化且紧跟实际案例的教学内容、科研融入教学实践、引入研究生“头脑风暴”式的培养模式以及建立健全考核评价机制等建议。通过深度考虑学生的个性化需求,提升学生学习这门课程的积极性与主动性,从而改善课堂教学的效果,提高教师的教学质量。

参考文献:

[1] 丁毅涛.大数据时代下的数据挖掘课程改革探索[J].科技风,2021(27):27-29.

[2] 朱毅,李云,强继朋,等.数据挖掘课程教学模式改革与探索[J].科教文汇,2021(18):108-109.

[3] 陈芳,张道强.以学生需求驱动的数据挖掘课程教学改革研究[J].软件导刊,2020,19(9):274-276.

[4] 王建新.数据挖掘课程中数据思维的培养方法探索[J].计算机教育,2019(8):117-120.

[5] 宋薇,李倩伟.软件工程专业《数据挖掘》课程教学改革研究[J].软件导刊,2015,14(12):212-214.

[6] 鲁江坤.以项目驱动的应用型高校数据挖掘课程改革研究[J].通讯世界,2021(4):153-154.

[7] 汤显,石蕴玉.新工科背景下数据挖掘课程教学改革与探索[J].教育教学论坛,2019(42):141-142.

[8] 杨秀璋,武帅,夏换,等.大数据时代数据挖掘与分析课程教学改革探究[J].计算机时代,2021(9):107-111.

【通联编辑:谢媛媛】

收稿日期:2022-05-15

作者简介:蔡赛华(1990—) ,男,江苏海门人,讲师,博士,研究方向为数据挖掘和数据处理、异常流量检测。

上一篇 点击页面呼出菜单 下一篇