网络数据采集与处理课程教学模式改革

作者: 李林瑛 刘朝霞 关菁华

网络数据采集与处理课程教学模式改革0

关键词:网络数据采集;三阶递进式;课程改革;百度AIStudio平台;头歌平台

中图分类号:G642 文献标识码:A

文章编号:1009-3044(2024)28-0146-03

0 引言

大数据、人工智能等技术引领数智时代的发展,促进了产业结构的转型与升级,进而对我国研究生教育培养和创新素质提出了新的要求[1-2]。图书情报专业涵盖多学科前沿知识,具有典型的跨学科、实践性强等特点。因此,如何在数智时代新环境下拓展专业内涵,构建适应新时代图书情报专业研究生培养的课程体系,是当前必须面对的问题[3]。

传统的图书情报专业教育模式已无法满足数智时代对人才的需求,课程改革势在必行。同时,我校图书情报研究课题大多与数据分析和机器学习模型相关,因此网络数据采集与处理课程在我校图书情报硕士人才培养中占有重要地位。孙文龙等[4-6]利用问卷调查、网络分析的方式分别对国内情报学、图书馆学研究生课程进行了系统调研,结果表明关于大数据技术、机器学习等课程设置不足,且未形成系统化。欧美高校通过建设“图情+”项目,引入企业背景师资,采用综合实践等创新教育模式,系统提升了学生的专业素质[7-8]。与欧美高校相比,国内高校在该领域的课程建设仍处于起步阶段,存在以下问题:开设时间较短、缺乏完善的体系化规划、实践平台薄弱、理论与实践的结合程度低以及教学内容与业界需求之间的联系不够紧密[9]。

在新工科背景下,图书情报专业的数据分析和人工智能人才培养更加重视实际应用。这意味着需要图书情报专业能够满足社会和企业对应用的迫切需求。课程建设是人才培养的基石和关键环节,本文以应用型人才培养为目标,针对网络数据采集与处理课程的实践教学模式进行改革,提高实验实训的参与度,提升学生的实践能力。

1 课程特点分析

目前,由于图情行业对人才的多样化需求、师资力量薄弱和实验平台硬件高要求的特殊挑战和困难,该课程面临一些迫切需要解决的问题。

1.1 实验软硬件环境滞后

网络数据采集与处理课程的深度学习模型部分,需要图形处理器(Graphics Processing Unit,GPU) 计算资源和复杂的环境配置,当前学校机房软硬件环境滞后,导致学生无法进行深度学习模型的实验,限制了他们实践能力的提升。

1.2 行业案例和项目选题缺乏创新性

由于传统教学模式与行业实际需求脱节,导致学生难以理解知识的实际应用,无法解决现实中的复杂问题[10]。

1.3 课程实践性强,跨专业学生基础薄弱

该课程的教学效果高度依赖理论与实践的结合,实践至关重要。本课程需要学生掌握Python,尤其要熟悉使用其中的各种包,也包括Pytorch、PaddlePaddle 等不同的深度学习框架。同时,不同院校的图书情报硕士跨专业生源存在显著差异,武汉大学等校生源大多具备相关专业背景[10]。对于非图书情报背景的学生来说,有些学生可能自学了Python,但缺乏足够的编程训练。因此,如何根据学生的具体情况合理安排学时、线下、线上和课外学习内容,提高学生对专业的兴趣和热情,是课程教学设计须认真考虑的关键问题。

2 三阶递进式教学模式设计与探索

课程采用课堂、实验和项目的三阶递进式教学模式,以需求为导向凝练知识点,帮助学生将理论与实践相结合,激发解决实际问题的兴趣,从而满足企业和社会对人才的要求。

第一阶段:课堂教学。在这一基础阶段,教师通过授课向学生传授相关理论和编程方法。这个阶段强调调试代码能力的训练,也为后续的实践打下坚实的理论基础。

第二阶段:实验环节。在这一阶段,学生亲自动手完成验证性实验。学生将在这个过程中消化课堂所学的理论知识,运用理论知识指导实践,将学习到的实践方法转化为实际操作技能。

第三阶段:面向企业需求的项目实践。学生以小组方式学习企业实践案例。这一阶段旨在提升学生的综合应用能力和创新思维,培养他们应对实际工作挑战的能力。

基于以上三阶递进式教学模式设计思路,本课程采用头歌实训平台和百度AI Studio平台对课程的实践教学模式进行改进和创新。在课程教学中,首要确定运行Python的编程环境,Python实验平台选择头歌在线实训平台。该平台采用游戏化闯关的形式,有效激发了学生的学习兴趣和主动性。

同时,深度学习实验对GPU算力有较高要求,本校实验环境难以支撑此类实验实践教学。而且,在以往实验教学设计中,教师需要安装和配置相对复杂的软件环境。受认知水平的影响和自主学习能力的差异,部分学生在自行安装实验环境时也面临重重困难,加之学生的沟通和协作意识不强,阻碍了学生学习的热情。为解决以上问题,课程经综合考虑选择了百度AIStudio平台。与其他深度学习平台相比,百度同时为每位开课老师和选课学生提供免费GPU算力,免费的算力和在线的开放平台能够为老师在平台上建课和授课提供极大的便利性。平台还提供了丰富的样例工程和各领域数据集,以及云端的计算和存储资源,可以快速搭建以行业应用为驱动的项目实践教学平台。

2.1 课堂教学过程

课堂教学配套的资源丰富多样,方便学生根据需要学习知识点。为了应对内容繁杂、知识点众多的课程,教师可以将各种类型的资源上传到头歌平台,包括PPT、视频、音频等,以便学生有针对性地选择学习。在授课过程中,教师可针对性讲解内容,其中数据采集、数据预处理和机器学习是授课的重点。

课程内容传授过程分为课前和课中两个环节进行设计,旨在实现翻转教学效果。课前,学生在课外完成基本的知识点学习,通过自学和在线资源掌握基础理论。课中,教师在课堂内通过辅助教学,帮助学生巩固和提高所学知识。这种设计不仅提升了课程的授课效果,还增强了学生的学习体验。通过课前自主学习和课中互动教学的结合,学生能够更好地理解和应用所学内容,从而实现更高效的学习成果。

2.1.1 课前环节

课前环节包括学期开课前准备素材、定时发布教学内容和学生按要求完成预习任务。具体步骤如下:1) 教师准备课程素材;2) 平台发布内容;3) 学生独立学习和自测;4) 测试题与统计。通过这样的课前准备环节,学生能够在上课前建立起对课程内容的初步理解,为课堂上深入学习和互动讨论打下良好的基础。

2.1.2 课中环节

课中教学部分以问题或者项目为导向归纳核心知识点,将原来课堂教学内容、教学环节重新分解再造,划分成10~20分钟为单位的授课阶段,每个阶段后辅以投票、测验、问答讨论等教学环节,完成知识点的学习。授课过程中采用理论结合实践的方法,先讲解理论原理,再结合1~2个实践案例进行讲解。

实践证明,学生能够迅速理解飞桨框架相关的深度学习代码,这不仅加强对深度学习理论的理解,还使得课堂教学更加流畅。此外,通过实际应用飞桨框架,学生逐渐增加了对国产深度学习框架的信心和热情,达到课程思政的教学目标。

2.2 基于头歌开展线上基础实验

基础实验内容遵循以下原则:

1) 实验题目具有新颖的特点,能引起学生的兴趣;2) 实验内容与理论授课内容相匹配,能够加深对理论内容的理解;3) 实验可进行自动评测,降低教师评价工作量。

基于以上三原则,课程在头歌平台创建了在线基础实验课程。

在实验课之前,要求学生预习相关资源。实验过程中,教师讲解实验细节,学生通过自己动手实践。若遇到问题,学生可以在讨论区与教师和同学讨论,但不得张贴答案。完成实验后,学生将获得闯关成功的提示。整个实验设计如图1所示,共包含41个基础实验。

2.3 基于AI Studio开展项目教学

本课程在项目实践环节主要来自AI Studio中的“飞桨产业实践范例库”,其项目背景和需求与企业密切相关。同时,百度AI Studio平台提供了丰富的资源,包括社区、算力、课程、比赛等。课程在充分借鉴平台优秀案例的基础上,进行了二次开发,以完善课程线上实验资源。这种方式不仅结合了平台的优质资源,还根据学生的具体需求进行了调整,确保教学内容更具有针对性和实用性。

我校生源来自多个不同专业,为降低与任务相关背景知识的学习难度,课程以情感分析单一任务讲解三大深度学习模型,不再介绍图像分类、信息抽取、问答系统等多个自然语言处理任务,而是将这种多样化需求体现在学生自选项目上。图2所示是在AI Studio 平台上搭建的课程网站。

2.3.1 项目题目筛选

项目选题符合实际应用场景。选题从行业应用出发,使学生从了解行业需求,逐步提高能够解决复杂工程问题的能力。选题不应仅仅是为了实现某个模型,而是要与实际工程应用所面临的问题相关联,让学生在解决项目中的挑战时能够运用所学知识和技能。表1展示了2023年秋学期课程选择的6个“飞桨产业实践范例库”中的题目。

2.3.2 项目的实施过程

项目实施采用课内和课外相结合的方式。课内学时为学生与指导教师提供了交流和讨论的机会。学生被要求在百度AI Studio开源项目中进行工作,并在项目讨论区发布项目进展,以便教师和同学进行点评和互评。这种开源项目的方式进一步提高了学生的参与度。项目的评估通过期末答辩和项目报告进行综合衡量。

2.3.3 项目的总结延伸

为了进一步推动学生参与大数据和人工智能领域的创新实践,课程采取以下措施:1) 表彰和奖励;2) 组建兴趣小组。通过这些举措的实施,可以看到越来越多的学生对大数据和人工智能充满热情,并积极参与学习和实践,取得了令人瞩目的成就。这种积极性的提升对于培养学生的实践能力至关重要,不仅能够促进个人的成长,还能够为整个行业的发展注入新的活力和创新力。在2023年9月举办的“泰迪杯”数据分析技能赛中,课程所在班同学均报名参赛,获得国赛二等奖2项和三等奖5项的优异成绩。

3 结论

针对企业对图书情报专业学生的需求,本课程对网络数据采集与处理课程进行了有针对性的设计和实践,更加注重数据分析和机器学习技术在行业中的应用。为了解决课程实验中的难题,本课程从基础到综合逐步搭建了集成教学环境,并进行了多轮教学实践。通过这些措施,成功解决了软硬件环境搭建困难、行业数据集获取缺乏和教学设计缺乏针对性等问题。集成教学环境的建立不仅简化了教学过程,提高了学生的学习效率和实践能力,还进一步为其综合素质和职业发展打下了坚实基础。未来,将探索将大型语言模型(如ChatGPT) 应用于课程教学,以进一步提升学生的代码编写能力和创新实践能力。

上一篇 点击页面呼出菜单 下一篇