课程思政与专创融合在数据挖掘技术课程建设中的研究与实践

作者: 陈益能 潘显民 任青山 李治 廖宁 陈艳 彭希希

课程思政与专创融合在数据挖掘技术课程建设中的研究与实践0

摘要:以新工科背景下工程教育专业认证目标为导向,针对数据挖掘技术课程在课程思政与创新创业融合中存在的教学认知不足、教学设计不完善、缺乏有机统一等问题,构建了“思想政治引领、专业知识支撑、创新创业实践”“三位一体”的思创育人模式教学体系。以亲和性分析方法推荐电影为例进行了教学实践。结果表明,该思创融合的建设举措能够激发学生学习兴趣,提升创新思维和创新意识,有效促进德育与高质量创新型人才培养。

关键词:课程思政;创新创业教育;新工科;数据挖掘技术

中图分类号:G642 文献标识码:A

文章编号:1009-3044(2025)01-0139-04 开放科学(资源服务) 标识码(OSID) :

0 引言

新工科强调培养学生的跨学科综合能力、实践能力和创新能力[1],而工程教育专业认证要求学生不仅具备解决复杂工程问题的理论与技术能力,还需具备社会和安全意识、法律和环保意识、职业精神和道德等思政素质要求[2-3]。因此,将课程思政和创新创业教育融入专业教育,构建“思想政治引领、专业知识支撑、创新创业实践”的“三位一体”的育人模式,培养具有独立思考能力、扎实专业素养和强烈创新意识的综合型人才,实现全过程协同育人的目标,为培养高素质的新工科人才提供有力保障。

数据挖掘技术是一门重要的专业课程,面向数据科学与大数据技术专业三年级本科生开设。课程共48学时,其中理论学时24,上机学时24。通过本课程的学习,要求学生掌握预处理技术和数据挖掘技术,重点学习关联、分类、聚类挖掘的原理及其算法。

课程以大数据挖掘的算法和应用为主要内容,熟练运用Python编程挖掘数据背后隐藏的内在信息[4]。教学在机房进行,采用线上线下混合式教学模式,通过思创教育融入各环节,使学生具备将复杂实际问题转化为数据挖掘问题,培养学生的数据思维、高阶思维和创新思维,培养自主、合作、探究能力以及解决复杂实际问题的综合能力;使学生养成“用数据说话”,透过现象看本质的思维习惯,培养探索未知、求真务实、勇攀高峰的使命感,建立家国情怀与科学素养,实现立德树人。

1 课程教学现状分析

1.1 教学认知不足,重知识传授轻能力培养

教师为了赶进度多采用“满堂灌”的教学方式,这种教学方法较关注的是如何在课堂教学中将知识点传授给学生,并且课程教学环节总是以套路化的固定框架呈现[5]。学生在教师事先设定好的框架下陷入被动的学习模式,仅仅满足于对书本知识的记忆和理解,缺乏探究性思考、批判性思维训练和创新能力培养,难以深入掌握专业知识的精髓。长此以往,学生面对复杂问题时就会束手无策,无法进行独立的分析问题与解决问题,影响学业成绩和专业素养的提升,也无法满足当今社会对创新型人才的需求。

1.2 教学设计有待改进

专业教育、思政教育、创新创业教育尚未深度融合,“三张皮” 问题依然存在[6-7],需要根据课程特点改进教学设计,以核心要素、实施点、案例、项目等形式与知识体系并行设计教学内容。在专业课程中,可以融入课程思政的元素,如政治认同、民族文化、精神美德等,以培养学生的价值观和社会责任感。同时,也可以将创新创业的内容融入专业课程中,如创新思维、创业能力的培养,以提升学生的创新意识和创业能力。

1.3 缺乏有机统一性

课程思政的教学内容更多聚焦于理论知识的民族文化、精神美德等,课程思政元素深度挖掘不够,忽视了创新创业教育内部所包含的深层思政意蕴,思政内容与创新创业教育未能有机结合[8]。在案例与项目教学实施过程中,注重挖掘其中的思政元素,并将其与专业知识和创新能力培养目标相结合,实现思政元素和创新能力有机统一。

2 课程教学体系设计

2.1 教学内容设计

该门课程立足于大数据角度,从算法原理和技术应用两个方面规范和指导大数据分析和挖掘的全过程[9]。因此,在开展数据挖掘教学中,重点从强化创新意识、哲学原理、家国情怀、职业道德等方面着手开展课程思政与专创融合;通过分析案例,引导学生思考和讨论创新创业和思政问题,培养学生的分析问题和解决问题的能力;以项目为载体,让学生在完成项目的过程中,实现创新创业和思政教育的融合。以用亲和性分析方法推荐电影为例,通过深入梳理数据挖掘课程的思政元素和创新创业融入点,列出课程知识点与思创融入点之间的映射关系。课程思创教育融入点及育人目标具体体现如表1所示。

2.2 教学方法设计

通过对前置课程中学生学习情况和掌握程度的深入分析,以及课堂代码检查与作业批改等环节,发现学生们在代码中存在较多低级错误。这一现象从侧面反映出学生平时代码量不足,动手能力有待提高。鉴于此,除了讲解知识点之外,最为重要的任务便是着力提升学生们的代码能力。

在提升学生代码能力的过程中,最为关键的一步在于帮助学生克服面对代码错误时的畏难情绪。具体而言,要教会学生阅读报错信息,使其能够耐心且有技巧地调试代码错误。在课程前半学期,频繁进行课堂代码抽查,并直接与学生在 QQ 上交流,以此带动学生的积极性。认真对待每一位学生,通过老师反复调试错误的过程,缓解学生对代码错误的畏难情绪,引领学生正视代码错误,使其不再畏惧,进而分析代码错误,并引导学生自行修改错误,让他们获得解决代码错误的成就感。

此外,借助“ 头歌实践教学平台”,引入优秀在线资源。学生在真实的编程环境中可直接在平台上编写、运行和调试代码,系统能够立即评估并给出反馈。这种即时反馈机制有助于学生迅速发现代码错误并及时改正,从而提升学习效率。头歌实践教学平台以实战练习、及时反馈、多样化资源以及项目驱动的学习方式,显著提高了代码学习的效果。

3 案例实践

3.1 亲和性分析的概念、特点和应用场景

亲和性分析根据样本个体(物体)之间的相似度, 确定他们关系的亲疏。连接实际应用,与课程内容相结合,通过“人脸识别”“行程码”“健康码”等生活情境介绍亲和性分析的概念、特点和应用场景。强调国内科学家的贡献,激发学生的民族自豪感,通过Apriori 算法科学家徐伟激发学生“文化自信”“民族自信”以及创新意识。

3.2 用实例讲解Apriori 算法最小支持度参数及其计算方法

最小支持度参数在Apriori算法中的作用至关重要,合理设置最小支持度参数能够帮助挖掘出更有价值的关联规则。以辩证性和创新性的方式灵活调整参数,深入发掘潜在关联,并紧密结合实际场景进行分析决策,最大化让学生理解最小支持度参数及其计算方法,培养学生在数据挖掘过程中的批判性思维以及创造性解决问题的能力。最小支持度参数及其计算方法如图2所示。

3.3 教师提问引出Apriori 算法的频繁项集的概念、作用

在Apriori 算法中,计算频繁项集需要多次重复扫描数据库,引导学生“成功不是一蹴而就的,需多维度培养和锻炼自己的耐心”,强调频繁项集中蕴含的执着专注、精益求精、一丝不苟和追求卓越的工匠精神。

问题:如何加快大数据集的处理速度和数据挖时间?

引导学生思考:从提出问题开始,让学生思考大数据集处理速度的提高方法,引导从数据集中找出频繁项集是一种加快处理速度的方法,为后续讨论做铺垫。

讨论频繁项集概念:从数据集中频繁出现的商品中选取共同出现的商品组成频繁项集

讨论频繁项集作用:剔除不够频繁的项集,减少测试新规则所需的时间,从而缩短大数据集的处理速度和数据挖时间。

3.4 亲和性分析建模方法和步骤

第一个阶段,给Apriori算法指定一个成为频繁项集所需的最小支持度。任何小于最小支持度的项集将不再考虑。最小支持度要合理,其值不能过小也不能过大。

第二个阶段,根据置信度选取关联规则。设定最小置信度,返回一部分规则,或者返回所有规则,供用户选择。

从亲和性分析的步骤出发,引导学生思考哪些环节可以与量变和质变的哲学原理相对应。置信度和支持度的提升是量变,达到一定阈值使结果确定是质变。规则发现部分,说明初步形成规则是量变,而当达到临界点出现新的深入关联和规则时是质变。新认识形成部分,指出通过分析形成新理论和模型是质变,而新理论和模型又指导新的数据收集和分析进入新的量变过程。

3.5 数据集下载和分析,引导学生分析问题、解决问题

3.5.1 数据集下载和存储

数据集来源:采用美国明尼苏达大学的Grouplens 研究团队公开的电影评分数据集数据集选取:包括几个大小不同的电影评分数据集,分别有10万、100万和1 000万条电影评分数据。

引导学生根据可信度和电脑配置选取数据集,并分析三种不同数据集的特点和可信度。学生探索下载和存储100万电影评分的数据集。分别从确保分析结果准确性、建立信任和可靠性、促进数据共享和合作三个方面强调数据可信度的重要性。

数据集下载网址:http://grouplens. org/datasets/movielens/

3.5.2 数据集分析

Movie数据集由用户ID、电影ID、评分等级、时间4个数据属性组成100万条电影数据。通过分析稀疏数据,学生可以理解如何利用有限信息做出有效的决策。引导学生思考如何利用技术改善社会问题,如通过推荐系统提高消费者的购物体验、优化资源分配等,从而培养学生的创新能力和社会责任感。

3.6 电影推荐项目实现

通过字节跳动公司的短视频,介绍Tiktok 的推荐算法独步天下,引入我国民族企业字符跳动在美国遭受全面打压,在激发学生爱国热情的同时,树立学生的专业自信心。

3.6.1 加载库

讲解Pandas库的开源背景,鼓励学生参与开源项目,学习合作与共享的精神。引导学生关注开源精神、技术伦理、数据隐私和社会影响,不仅能够提升他们的技术能力,还能培养他们的社会责任感和职业道德,为技术应用和社会进步做出积极贡献。

3.6.2 加载数据并处理数据集

1) 加载数据并处理数据集。引导学生讨论数据隐私保护的重要性,如何避免未经授权的数据使用,如何确保数据匿名化,培养学生在数据处理中的伦理意识。

2) 生成、验证频繁项集,直至生成最长频繁项集。在数据挖掘中,频繁项集挖掘是一个关键过程,特别是在关联规则学习中,涉及从数据集中提取频繁出现的项集。在分析过程中,引导学生关注数据隐私保护,确保数据使用符合伦理法规。分析结果的社会影响,确保数据驱动的决策对消费者公平。学生可以利用频繁项集分析结果进行市场预测,开发新的产品或服务,例如个性化推荐系统。

引导学生关注数据隐私、社会影响和公平性,并鼓励他们利用数据驱动的洞察发现市场机会,实现技术和伦理的双重成长。

3) 新频繁项集结果。在频繁项集挖掘过程中,要求每一步数据处理、算法实施和结果验证中都做到精益求精,确保分析结果的高质量和实际价值,工匠精神至关重要。

3.6.3 抽取关联规则

1) 生成关联规则。可以从频繁项集中抽取出关联规则,把其中几部电影作为前提,另一部电影作为结论。引导学生讨论如何避免算法偏见,如何在分析过程中识别和纠正偏见,确保生成的规则对所有用户公平。

2) 计算置信度,输出置信度前5的电影名。通过计算电影推荐系统中的置信度可以揭示用户对某些电影组合的强烈偏好,创新推荐算法,学生可以从数据中发现潜在的市场机会和用户需求。计算置信度的应用可以激发学生的创新思维,帮助他们利用数据分析发现市场机会、优化产品和策略。

上一篇 点击页面呼出菜单 下一篇