基于问题导向的混合式数据挖掘课程教学模式探索
作者: 王维 孔超
摘要:随着数据成为驱动创新发展的核心要素,高校亟须培养兼具扎实理论基础和实践能力的数据挖掘人才。然而,传统数据挖掘教学模式过于注重理论知识的传授,忽视了对学生实际问题解决能力和创新思维的培养。为此,本文提出一种基于问题导向的混合式教学模式,将数据挖掘实践问题融入整个教学过程中,并有机结合线上线下教学资源,引导学生从问题出发,逐步深入地掌握数据挖掘知识和技能,从而提升其分析问题、解决问题和创新思维的能力。
关键词:数据挖掘;问题导向;混合式教学;创新
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2025)04-0170-04 开放科学(资源服务) 标识码(OSID) :
0 引言
随着科技的发展和智能设备的普及,数据已成为新的生产要素。据不完全统计,全球数据量正以指数级速度增长,2020年已达到60 ZB,预计到2035年将突破2142 ZB[1]。在国家大力推动“互联网+”战略的背景下,发展大数据已成为重要组成部分。国家鼓励企业和科研机构加大对大数据技术的投入,以加速我国从传统经济向数字经济的转变。《“十四五”大数据产业发展规划》强调,到2025年,国内大数据产业测算规模突破3万亿元,年均复合增长率保持在25%左右。目前,数据挖掘技术已经广泛应用于商业、金融、医疗等多个领域[2]。通过数据挖掘技术,企业可以从海量数据中提取出有价值的信息,从而提升竞争力并推动创新[3]。例如,京东、淘宝等电商平台通过挖掘用户的历史购买记录、浏览行为和评分等数据,向用户推荐个性化的商品或影视作品,提高用户的购买转化率。随着各行各业对数据挖掘技术的应用日益广泛,对数据挖掘人才也提出了迫切需求。
数据挖掘课程具有较强的交叉性,涉及数学、统计学、计算机科学等多个学科领域,强调理论与实践相结合以及问题解决能力的培养。同时,数据挖掘技术发展迅速,知识体系不断迭代,这极大增加了授课难度。面对日益增长的数据挖掘人才需求,探索有效的教学模式显得尤为重要。
1 数据挖掘课程教学挑战
数据挖掘作为一门新兴且高度应用的交叉学科,其教学过程面临着诸多挑战。这些挑战不仅源于学科本身的复杂性,也来自对教学模式的探索。
1.1 教学模式单调
传统教学模式以教师讲授为主,授课教师往往拘泥于教材,教学理念相对陈旧,课程体系也显得僵化,学生被动接受知识[4]。同时,教材和教学内容常常滞后于技术发展,面对快速发展且实践性极强的数据挖掘课程,教师常感力不从心。在教学评估方面,传统模式主要通过考试来评估学生的学习效果,这种方式难以全面反映学生的实际能力。上述情况导致学生的学习兴趣下降,同时也限制了学生对知识的深入理解。此外,受限于学时,许多数据挖掘前沿技术常常被忽视,学生难以将最新的理论知识应用于实际问题,从而限制了其解决问题能力和团队协作能力的培养,无法满足当下对应用型人才的需求。
1.2 基础知识要求高
数据挖掘作为一门交叉学科课程,其知识体系融合了多个学科领域,这使得数据挖掘课程对学生的基础知识提出了较高要求。理想情况下,学生在学习数据挖掘课程之前应具备扎实的数学基础、统计学知识、数据库知识以及一定的编程能力。然而,在实际教学中往往存在以下问题:首先,前置课程与数据挖掘课程之间的衔接不足,各门课程缺乏系统性的联系,导致学生在学习数据挖掘课程时难以将之前学过的知识融会贯通。其次,学生的基础差异较大,掌握前置课程的程度因人而异,编程水平也各不相同,这给教师的教学设计带来了挑战。
1.3 实践内容不足
当前数据挖掘课程普遍存在实践内容不足的问题。大多数教材过于注重理论知识的讲解,缺乏深入浅出的实践案例。虽然学生掌握了算法原理,但在面对实际数据集时,往往不知从何下手。仅凭理论知识,学生难以有效整合数据预处理、特征工程、模型选择和模型评估等整个数据挖掘流程。此外,许多教材中的算法和附带数据集与实际应用场景脱节,教材中的数据集或过于干净,或规模较小,导致学生缺乏处理复杂和脏数据的经验,难以培养其解决实际问题的能力。如何将理论知识与实践应用有效结合、如何激发学生的学习兴趣和创新思维、如何培养学生解决复杂数据问题的能力,已成为当前数据挖掘课程教学亟须解决的关键问题。
1.4 社会需求脱节
当前的数据挖掘课程普遍以传统机器学习算法为核心教学内容。然而,随着大数据时代的到来,这些算法在处理复杂、高维和非线性数据时逐渐暴露出局限性。近年来,深度学习技术的迅猛发展为数据挖掘领域带来了革命性的变革,并在诸多领域取得了显著成果[5]。然而,许多高校的数据挖掘课程仍停留在传统的教学内容上,对深度学习技术的覆盖不足。这种教学内容与实际产业需求的脱节,导致毕业生在就业市场上的竞争力不足。企业在招聘数据挖掘人才时,越来越看重求职者对深度学习框架相关算法的掌握程度。此外,传统数据挖掘课程中所使用的数据集也与现实场景存在较大差异。教材中的数据集通常规模较小、特征简单且数据质量较高,这与企业实际面临的海量、高维和噪声数据存在显著差异。学生在学习过程中缺乏对真实世界数据复杂性的深入理解,从而在面对实际问题时难以有效解决。
2 问题导向的混合式教学模式构建
为了解决传统数据挖掘课程教学中存在的问题,本文提出一种基于问题导向的混合式教学模式。该模式以培养学生解决实际问题的能力为目标,将问题驱动、案例教学和混合式学习等多种教学方法融入数据挖掘课程教学的各个环节。
2.1 数据挖掘课程在线慕课/微课资源
针对数据挖掘课程对基础知识要求高的挑战,打造一个系统化、互动性强且覆盖面广的数据挖掘慕课资源库,以降低学习门槛并提升学习效率。首先,在丰富的在线慕课资源库中,为每堂课精心挑选与课程内容高度契合的统计学、线性代数和数据库等基础知识模块。这些模块内容将根据学生对本堂课内容的预备知识掌握情况,教师在课前通过学习通或雨课堂进行有针对性的推送。通过快速复习巩固,学生能够将课堂时间最大化地用于新知识的学习和应用,有效提升学习效率,从而解决学生基础知识薄弱的问题。其次,考虑到学生学习方式的多样性,每位同学可以基于在线慕课资源定制微课学习方案。通过微课学习方案,能够清晰呈现数据挖掘课程的重点,便于同学们根据自身需求灵活安排学习时间。基于数据挖掘课程的在线慕课资源,可以支持学生的个性化学习需求,提升学习效率。
2.2 数据挖掘课程在线实践平台资源
针对传统数据挖掘课程在授课过程中面临的实践内容不足的挑战,构建数据挖掘课程在线实践平台,使学生能够灵活开展数据挖掘实践,提升动手能力。首先,通过深度采用诸如EduCoder等线上实践平台资源,学生在无须购买昂贵计算机硬件的条件下,获得一个稳定、高效且互动的低成本学习环境。其次,利用在线实践平台构建多种任务场景下的海量数据集,提供多样化的学习材料以及在线编程环境,对学生的数据挖掘处理流程进行实时反馈,帮助学生快速发现并纠正错误,同时平台提供多种可视化工具,帮助学生直观理解数据和模型。最后,学生可以根据自己的兴趣和水平选择不同的数据挖掘学习路径,而平台也可以根据学生的学习情况推荐适合的学习资源。基于数据挖掘课程在线实践平台资源,为数据挖掘课程学习提供了全新的模式,充分培养学生处理实际问题的能力。
2.3 数据挖掘课程线下实践基地资源
针对传统数据挖掘课程面临的社会需求脱节挑战,构建数据挖掘课程线下实践基地资源,以提升学生的数据挖掘实践能力。首先,本文在具体实施过程中依托学院的大数据产业研究院,为实践基地搭建完善的硬件和软件环境,以满足大规模数据处理的需求。其次,通过在实践基地定期开展数据挖掘综合项目,让学生从数据采集、清洗、算法建模到结果分析,完整地经历典型数据挖掘项目的处理过程,加强学生对知识体系的融会贯通。最后,积极与企业开展相关合作,由企业提供真实的数据集供学生进行分析和建模,使学生能够参与实际业务场景中。通过建立线下数据挖掘实践基地,为学生提供真实的数据环境和项目实践机会,培养具备扎实理论基础和丰富实践经验的数据人才。
3 教学过程设计
以问题为导向的数据挖掘教学过程,通过设计真实、开放且具有挑战性的问题,将问题导向贯穿于整个教学过程,从而激发学生主动思考,培养其分析问题和解决问题的能力[6]。相较于传统授课方式,基于问题导向的教学模式更能培养学生的批判性思维、协作能力与创新能力。
3.1 问题导向的课前教学策略设计
在课前阶段,应明确本次课程的学习目标与问题设置,并紧密结合数据挖掘的实际应用场景和行业热点。首先,设计课程预习任务,针对本次课程的教学内容,引导学生使用混合式数据挖掘课程资源提前掌握基础知识。然后,提出具有挑战性且与学生兴趣点契合的问题,问题设计应兼具启发性和挑战性,既能激发学生的学习兴趣,又能促使其深入思考,进而主动探索解决方案。最后,鼓励学生通过查阅文献、观看教学视频等方式自主探索问题的解决方案,并形成初步思路。在这一阶段,授课教师应充分利用混合式数据挖掘课程教学资源,帮助学生更好地完成课前准备任务。
3.2 问题导向的课中教学策略设计
在课中阶段,教师应以问题驱动,并结合场景引入。首先,教师可以抛出一个贴近生活的实际问题,引导学生思考数据挖掘技术在解决此类问题中的作用。接着,通过分析经典的数据挖掘案例,将抽象的理论概念具象化,帮助学生更好地理解数据挖掘技术的应用价值。然后,进行理论讲解与实践结合的教学环节。教师要系统地讲解案例中涉及的数据挖掘概念、算法原理和常用工具,并结合具体案例,将抽象的理论概念转化为易于理解的知识点,帮助学生建立知识体系,为其打下坚实的理论基础。在此阶段,教师还需通过课堂演示、分组编程等方式,引导学生动手实践,将理论知识应用于实际问题的解决中,培养学生的编程能力和问题解决能力。最后,进行分组讨论与合作学习。围绕案例中特定的数据挖掘问题展开讨论,鼓励学生分享观点、互相启发。在小组合作中,培养学生的团队协作能力和沟通能力,共同寻找问题的最佳解决方案。同时,授课教师需要鼓励学生对小组讨论成果进行相互反馈,分享经验,促进相互学习。
3.3 问题导向的课后教学策略设计
在数据挖掘课程的课后阶段,授课教师应通过布置典型的数据挖掘问题、提供及时的反馈、利用混合式数据挖掘课程教学资源以及组织学生进行作品展示,促进学生对数据挖掘知识的深入理解和应用,培养其解决实际问题的能力。首先,针对课堂内容,设计典型问题并提供相应的数据集。同时,引导学生通过查阅文献、搜索资料等方式,深入探索问题的本质,并提出自己的见解。随后,指导学生采用在授课阶段学习到的数据挖掘算法,对问题进行建模。在解决问题的过程中,鼓励学生充分利用线上平台资源。最后,建立在线讨论平台,方便学生随时提问和讨论。教师可及时解答学生的疑问,提供个性化指导,并推荐高质量的学习资源,如学术论文、开源代码等,以帮助学生拓展知识面。此外,在课后阶段,需要引导学生熟练使用数据挖掘高级工具,如 Python 生态下的Scikit-learn、TensorFlow、PyTorch 等。授课教师应提供高质量的代码示例,帮助学生理解工具的使用方法和技巧。通过掌握数据挖掘高级工具,不仅能提升学生的实践能力,还能使其更深入地了解行业前沿技术。
3.4 多元化课程过程评价机制构建
构建完善的数据挖掘课程过程评价机制,对于提升教学质量、促进学生学习效果具有重要意义。本教学模式从学习过程和学习效果两个维度进行课程过程评价。学习过程评价维度注重学生在学习过程中所展现的思维方式、学习态度和知识点掌握程度;学习效果评价维度主要关注学生最终的学习成果,即学生是否达到了预期的学习目标。学习过程维度下的评价指标包括在线慕课/微课学习时长、在线平台实践完成度、小组讨论参与度、作业完成情况和签到与课堂表现。学习效果维度下的评价指标包括实践项目完成质量和期末考试成绩。每个评价指标对应着适合的评分方法和权重,具体如表1所示。
通过构建多元化的课程过程评价机制,教师不仅可以了解学生的学习进度和掌握程度,还能发现学生在学习中存在的问题,并及时给予反馈和建议,从而帮助学生改进学习方法,提高学习效果。
3.5 问题导向的混合式课程教学优势