融合思政元素与知识图谱的项目化教学改革与实践研究

作者: 钟宏扬 井福荣 杨春雨 黄秀丽 张川

融合思政元素与知识图谱的项目化教学改革与实践研究0

关键词:网络爬虫;知识图谱;思政教育;项目化教学;教学改革

中图分类号:G642 文献标识码:A

文章编号:1009-3044(2024)26-0177-04 开放科学(资源服务)标识码(OSID) :

0 引言

随着信息技术的蓬勃发展,数据的规模、类型和价值日渐攀升,传统信息技术已经难以满足海量化数据的处理需求了,数据处理技术 (Data Technology,DT) 的重要性已经愈发凸显。在DT时代已经来临的大背景下,针对新时代新工科人才的培养需求,各大高校都在开展着大数据技术相关的教学改革。文献[1]将基于问题式学习的方式应用到大数据系列课程中,提升学生对于大数据技术学习的主人翁意识;文献[2]以翻转课堂教学为基础,为大数据分析课程教学融入项目化教学理念,丰富课堂师生互动;文献[3]利用OBE 理念对“大数据分析与建模”课程进行了教学改革,克服了该课程教学目标不准确、教学评价单一化的局限性。

作为实现大数据处理技术的前置关键技术,网络爬虫通过模拟浏览器发送请求,并按照一定的规则自动抓取互联网上的海量信息,为大数据分析提供多样化素材。网络爬虫课程学习过程中,学生也会接触到诸如HTML、CSS等广泛应用在大数据分析中的技术,网络爬虫也同样有利于学生理解DT的生态系统。

项目化教学强调学生的主体地位和自主学习,通过实践与反馈提升学生的学习成效。组织方式是教师通过将实际企业项目简化凝练为教学项目,学生运用跨领域知识自主设计、实施和评价一个具有挑战性的项目,从中深刻理解专业知识和技能。相关文献表明:由于教学项目大多是从企业实践中脱离出来,还是存在项目内容空洞以及知识片面断层等局限性,削弱了学生融会贯通、举一反三的能力[4-5]。疫情过后,线上线下的混合教学模式兴起,项目化教学这种学习自主化、个性化的课程模式越发受到各大高校的青睐。网络爬虫作为大数据系列课程的专业核心,其知识图谱也链接了先行课与后续课程的知识体系。因此,本文以知识图谱为依托,以融入思政元素的项目式教学为驱动,对网络爬虫课程进行教学改革探讨。

1 网络爬虫教学现状分析

1.1 传统思政教育难以贴合网络爬虫教学

传统思政教育通过弘扬民族精神、传播传统文化、宣扬文化自信的手段进行开展[6]。作为一门新兴的DT技术课程,强行融入以往的思政案例会令课堂显得异常沉闷,致使学生课堂参与度低[7]。不仅如此,传统思政课程的内容还缺少时代感,亟须信息化手段将重要会议精神融入思政课程设计中,同时建立敏感信息数据安全保护意识以及网络爬虫的使用道德和法律意识。

思政课程教育相关的师资水平还有待提升,专业的思政教师缺少对网络爬虫课程的学科背景了解,无法胜任思政课程的教学任务;而专业课的任课教师又对思政教育理解不到位,难以开展兼具深度和广度的思政教育[8]。教师需要通过启发式、思政案例等方式鼓励学生自主管理,培养其对网络爬虫技术应用的自我约束能力。

网络爬虫思政课程的评价体系也不够健全,评价维度过于集中在考试成绩,而没有涵盖对学生思想品德、价值观上的评价。更重要的是,当前课程思政缺少学生反馈以及教师反思,未形成完整的思政教育体系闭环。

1.2 传统纸质教材无法适应学习需求

网络爬虫等DT应用技术迭代更新速度快,加之各大电商、视频等网站的频繁维护更新,而纸质教材由于出版和印刷的周期较长,原有的一些案例代码在爬取数据网站(京东、bilibili) 更新网络结构后不一定能适用,导致学生对于教材案例无法复现,进一步挫伤了学生的学习积极性。

传统纸质教材更新周期长,内容缺乏前沿性,更加注重基础语法知识点的讲解,受限于篇幅难以提供足够的实验操作指导,并且纸质教材这种单向信息传递的授课方式缺少互动性与反馈机制,对于学生在自学过程中遇到疑惑时无法及时反馈。

1.3 理论与实践应用知识难以协调

网络爬虫课程安排的课时相对有限,大多数高等院校又采用理论实践一体化的授课方式进行讲解,而无论是理论实践各占一半,或偏重理论课时高占比,都难以让学生完全掌握理论知识点与实践案例。其原因一方面在于学生的个体差异化比较大,一些学生的编程能力与数据处理能力较强,可以快速掌握理论知识点并完成课堂练习任务,而另一些技术相对薄弱的同学则需要更多的指导与帮助;另一方面,教师展示的网络爬虫案例都是经典的案例,缺乏对内在逻辑的讲解,造成学生虽能复现却不知其所以然,学生自身并未形成解决问题的思路,脱离课堂后遇到问题仍然不知所措。

2 融合思政元素与知识图谱的网络爬虫项目式教学体系

为实现提升学生综合能力和数据处理、编程技能培养的课程目标,强化学生的创新能力和职业道德情操,培养大数据行业新时代的四有型人才,设计了如图1所示的网络爬虫的项目式教学体系。项目化教学的方式是基于问题式的教学形式开展,其理论来自建构主义,强调以学生为中心,教师从灌输者变为学生主动建构主义的帮助者。项目化教学的成功实践很大程度依赖知识引导地图和项目导航树的构建,知识图谱通过图的结构可以表达网络爬虫课程中服务器、浏览器和请求等实体、事件等概念,并对海量数据进行有序管理。教学项目任务均具有一定的梯度,项目导航树则需要将教学项目任务与知识图谱进行任务知识点映射后生成。

当课堂教学目标设定完成后,进入当前课堂的理论教学环节,教师将碎片化的知识点梳理、关联后,学生再结合项目案例进行具体学习和分析。因此,相比传统纸质教材,这将更有助于学生在构建网络爬虫的请求、解析和数据保存等知识点的学习路线。按照项目导航树索引逻辑知识结构对应的相关知识点,再将知识点对应的项目任务按照实训进度分派给项目成员。

项目式教学体系要求爬虫项目完成后,小组成员先对项目完成情况按照一定标准进行自评后,再将网络爬虫项目实战结果以可视化的形式分享给其他项目组成员进行互评打分。长此以往,课程就分解成若干个网络爬虫小项目,每个小项目的最终评分都会影响学生的过程性评价,教师结合最终期末考核成绩评定学生在网络爬虫课程的最终成绩。

3 融合思政与知识图谱的网络爬虫项目式教学模式实践

网络爬虫课程是佛山职业技术学院人工智能、计算机应用技术、大数据技术等专业开设的专业核心课程,采用的是理论实践一体化教学的授课模式,编程语言为Python语言环境。Python程序设计、HTML网页设计是该课程的先修课程。结合上述教学体系,课程组对网络爬虫课程开展了新教学模式的实践。

3.1 知识图谱构建

网络爬虫的知识图谱数据来源主要来源于课程项目库以及开源的网络爬虫知识图谱,其中数据存在的形式比较多样化,且具有一定的异构性[9-10]。如图2 所示,对于图片、JSON等半结构化和非结构化的数据需要通过“实体-关系-属性”抽取一些关键性的信息,并做结构化转化。从原始数据中获取到了实体、关系以及实体的属性信息后,将异构化数据提取的信息一并做知识融合,即过滤冗杂/错误的数据并进行数据逻辑归属。最后再通过本体构建、知识推理、质量评估和知识更新等过程构建网络爬虫课程的知识图谱。

网络爬虫知识图谱可以帮助学生更加自主地构建课程学习路径。网络爬虫技术由数据爬取、数据解析、数据存储的技术路线构成,先在不同的技术中识别出相应的知识点,譬如HTML、JSON格式数据解析的方式;而后,建立技术之间的关联性,例如学生需要在掌握爬取网页数据的requests库后,方可深入学习解析数据的BS4库。借助网络爬虫知识图谱还可以丰富课堂任务设置环节,鼓励学生采用正则表达式、bs4等不同的解析技术对相同的网页结构数据进行解析,并分析解析数据过程的异同,从而帮助学生深入理解技术对应的知识点内涵。

3.2 思政元素融入

将思政元素融入网络爬虫课程不仅有利于加深学生对爬虫技术的认识,也能帮助树立正确的理想价值观,而专业课程的思政元素需要与专业知识点进行关联才能发挥最大的效力。因此,首先需要对课程教学大纲的内容进行思政元素的融入,融入思政的网络爬虫课程规划如表1所示。

以网络爬虫的用途这一章节为例,在设计思政课程时,以培养学生网络安全与法律意识为德育目标,将利用爬虫技术非法收集个人隐私信息或者提供未经授权的数据等违法行为作为思政要点。以此说明网络爬虫程序的合法性,警示学生个人隐私数据或者明确禁止访问的数据不能爬取,更不能用于商业用途,否则会引起民事纠纷,甚至严重的将面临法律惩罚。

另以反爬虫策略这一知识点为例,网站常用的反爬虫技术包括通过Headers、用户行为来识别爬虫,以及采用动态加载数据来反爬虫。网站也提供了Ro⁃bots协议,告诉爬虫程序开发者怎样的信息不能抓取,否则可能会违反法律。在思政课程设计时,以培养数据安全意识为目标,提供因违规破解反爬虫策略而被判刑的案例素材,并予以警示。

3.3 项目驱动

网络爬虫课程在教学开展过程中以项目化的形式进行实践,项目包括不限于课程项目、企业项目、大学生创新创业项目等。将知识图谱中所涉及的网络爬虫知识点按照任务知识点映射关系,分别归属到相应的项目中,得到如图3所示的网络爬虫课程项目设计示意图。项目按照由浅入深的顺序开展,有道在线翻译通过介绍requests库让学生理解爬虫请求的基本构成部分,豆瓣Top250、京东商城和Q房租房项目侧重对爬取数据、解析数据和储存数据的知识巩固,中国知网项目则锻炼学生采用selenium模拟浏览器动态爬取网页数据。各项目实践环节都可以培养学生运用爬虫工具解决实际问题的能力以及团队协作能力,帮助学生形成大数据思维处理技术的知识体系。

网络爬虫课程引入了“传帮带”方式进一步优化了传统项目化教学。首先,所谓“传”即为从教师传授给学生的基于问题式学习的教学方式,针对项目中的关键要点抛出问题,并进行知识点解析,对关键过程进行操作演示后,检查学生是否可以对关键项目任务进行复现;其次,所谓“帮”则是鼓励项目完成时间早的小组帮扶项目完成有困难的小组,并以交互式讨论将项目经验分享,采用平时分加分的形式激励参与组间帮扶的同学;最后,“带”是项目组内分析各个项目任务环节,分析项目瓶颈,并由项目组长牵头协助瓶颈环节的攻克,确保爬虫项目程序能按时完成拉通,缩短项目完成周期。

鉴于课程学时有限以及学生能力差异化明显的现状,课程教学中采用“线上线下混合”的方式,依托超星学习通、学银在线等工具实现练习发布、课后问题讨论、考勤统计等。学生可以通过校内云平台将撰写的项目实训报告提交,实现师生的良性互动。

4 教学实践效果

网络爬虫课程在采用融合思政元素与知识图谱的项目化驱动教学后,专任教师在超星学习通平台上迭代优化教学资源,目前在线课程包含了24个教学课件,134个知识任务点,29个实训项目等涵盖思政理论的案例资源,受益的学生有将近500余人。

通过项目化教学,学生以团队的形式全程参与从需求分析、技术选型、代码编写到结果展示的网页爬虫项目开发,既培养了学生团队协作精神和创新能力,也激发了学生参加蓝桥杯、“互联网+”等竞赛的积极性。知识图谱化的网络爬虫教学资源强化了学生对专业技能学习的系统性,进而辅助学生自主解决问题,提升其学习主动性。在教学改革方面,专任教师主持教改课题以及发表教改论文的数量也保持增长。

5 结束语

网络爬虫技术作为DT时代的一项重要技术,是大数据相关专业的核心课程,本文建立了融合思政元素与知识图谱的项目化教学实践体系。首先,将网络爬虫领域的知识点整合处理为知识图谱;其次,对关联知识点嵌入思政元素,最后,将知识点以项目化形式开展教学实践,以期培养学生端正的职业素养和正确的价值观。本文提出的教学体系为学生参与企业真实项目开发提供良好的平台,对大数据系列课程思政以及实践教学具有一定的示范作用。

上一篇 点击页面呼出菜单 下一篇