

基于数据驱动的在线学习平台建设研究
作者: 马维
[摘 要] 数据驱动融合社区教育,对促进终身教育有特殊的现实意义。推动数据驱动技术在社区教育中的应用,不仅有助于提升教育质量和覆盖面,还能有效促进教育公平与社会包容,是构建可持续发展的教育生态系统的关键路径。基于云南的实际情况,在政策引导和多方协同的作用下,有机结合社区学习者与各类教育管理方需求,设计搭建服务于本土区域基于数据驱动的学习平台,寓功能服务于管理,双向互促,通过数据采集、分析与可视化,结果应用于区域资源的合理配置和投放,着重解决教育资源分布不均、跨越数字鸿沟及满足多元化学习需求等问题。研究提出的大数据系统建设方案为数字化转型提供了方向指引和技术框架,为学习型社会的建设提供了科学数据和实用方案,逐步形成服务全民终身学习的“互联网+终身教育”新形态。
[关 键 词] 数据驱动;公平和包容;在线学习;统计分析;数字化转型
[中图分类号] G647 [文献标志码] A [文章编号] 2096-0603(2025)03-0029-04
数据驱动融合社区教育,是理念和应用的互动和协同,是包容、现代、可持续发展的教育生态,能够将教育质量、公平和创新力三者有机整合,更好地服务于多元化的社会需求和个体成长。近年来,国家出台了多项政策,推动数据驱动在社区教育中的应用,以提升社区教育的效率、资源分配的公平性以及居民的参与度。《中国教育现代化2035》明确提出要建立服务全民的终身学习体系,扩大社区教育资源供给,在城乡、边缘地区和老年教育等方面大力支持数字化资源的普及[1]。《“十四五”国家信息化规划》中,国家继续深化数据驱动的教育信息化,特别是在终身学习的公共服务建设中,提出利用大数据和智能化手段支持社区教育发展,通过数据驱动分析实现个性化学习资源推荐和资源精准分配,以创建公平和包容的教育环境[2]。基于数据驱动在线学习平台的构建理念,探索线上课堂学习、团队组建、活动开展、培训项目实施。通过数据反馈机制帮助政府或社区教育管理部门优化资源分配,满足不同社区成员的学习需求,为教育公平和终身学习提供强有力的支持。
一、建设基于数据驱动的在线学习平台的目的
(一)优化资源分配
解决云南地区教育资源不足和跨越数字鸿沟的问题。云南地形复杂,教育资源分布不均,社区居民背景差异大。基于数据驱动的学习平台,能够为边远地区提供优质教育资源,针对性地投入适应本地差异的资源[3,4]。
(二)提高教育质量与效率
教育管理方可通过学习行为数据生成多维度分析图表,深入了解社区学习需求,调整教育内容和设计互动模块。通过不同模块的联动呈现,让学习者多层次体验线上学习,激发各类用户兴趣,满足不同年龄和文化背景居民需求。基于数据驱动的教育模式将吸引更多学习者,为未来的大数据分析平台积累充足的数据支持[5,6]。
(三)促进终身教育理念
多元化资源的服务,教育机构数据的共享、可视化的数据管理,有利于形成贯穿全生命周期的终身教育观念,实现社会整体进步与创新。
二、基于数据驱动的在线学习平台功能分析和架构设计
(一)平台功能分析
社区居民根据个体学习需求,自主选择适宜的学习资源、参与学习活动和技能培训拓展,以兴趣或服务为契合点,汇聚成团队,通过在线研讨、协作交流、分享成果。学习全过程中的行为数据将被系统全程记录,形成用户个人终身教育学习成果档案,为其学习历程提供科学依据与数据支撑。
系统功能主要分为后台管理、门户网站和数据统计分析三大板块,如图1所示。
后台管理:开放给前台用户的功能,包括资讯浏览、图书阅览、课程学习、活动参与、团队建设、话题发表等。
门户网站:配置、创建、管理各功能模块及各模块之间联动、功能权限分配及管理,对数据进行增删改等操作。
统计分析:根据前端开展各类学习业务,对学习过程性数据进行标准化处理后存储。提供数据分析与展示功能,建立分析模型,对用户学习行为数据进行分析,通过数据可视化工具展示分析结果。
(二)平台架构设计和技术路线
分析业务流程、平台功能与采集数据后期的利用,同时兼顾系统的安全性、模块化性、扩展性以及可维护性,以数据为驱动设计理念,系统可分为基础层、数据访问层、接口层、服务层、应用层和展示层。
基础层:提供整个系统运行所需的基础设施,包括操作系统、数据库、网络服务等,确保系统的稳定运行和资源管理。
数据访问层:负责与数据库进行交互,封装数据访问逻辑,使上层应用可以通过这一层来执行数据的增删改查操作,而不直接操作数据库。
接口层:定义和实现系统对外的接口,处理外部请求的接收、验证、路由和响应,是系统与外部世界交互的桥梁。
服务层:平台业务逻辑的实现,作为业务规则和数据处理的核心,协调数据访问层和应用层,确保业务流程的正确执行。
应用层:处理具体的平台业务需求,如活动参与、课程学习等,协调服务层和数据访问层,实现业务流程的开展。
展示层:学习网平台页面展示部分,通过前端交互式界面将信息展示给用户并接收用户输入,关注用户体验和界面交互设计。
三、基于数据驱动的在线学习平台的推广和数据分析
(一)平台推广及使用
在省教育主管部门的政策指导和经费保障的情况下,平台推广有序推进,并逐步扩展。2020年3月,云南省教育厅批复同意在云南开放大学挂牌成立云南省社区教育指导中心,依托开放大学办学体系,按照“两级指导中心、三级办学体系”推广平台的使用,确保平台能够稳定落地并持续发挥作用。推进过程中,教育机构的适应性和平台使用效果不断提升,功能逐步优化。自2022年4月平台上线运行至今,平台用户已覆盖全省各级地区,注册人数16.77万人,学习人次10.14万。随着用户数量的增长,平台积累了大量学习行为数据,为后续数据分析提供了坚实保障。
(二)数据采集来源和统计分析
1.学习平台
本平台会记录用户课程学习数据,这类数据是研究的主要来源之一。主要采集的手段为通过在系统前后端进行数据收集埋点,在用户访问平台的时候对行为数据进行收集,具体包括以下内容[4]:
用户基础数据:平台用户的基础信息包含所在地、文化程度、单位类别、性别、年龄等信息,目前平台注册用户记录为16.7万条。
登录日志:包括用户登录的时间、IP地址、操作结果等信息。
页面访问日志:包括用户访问某个页面的具体时间、是否已登录等信息。
登录记录数据:自注册完成以后,用户每次登录的记录数据,包括用户标识、用户登录时间及其他基础信息,累计采集到9.5万条登录成功的日志。
课程基础信息:平台提供给市民的学习资源数据,包括课程名称、课程图片、课程简介、课件名称、课件资源地址等信息,目前平台有超过162门课程、2532个学习资源。
课件播放记录:在展开本研究过程中,为了丰富资源学习数据维度,用户每次学习都单独生成一条日志,自2024年3月开始收集,至今累计5万条,主要记录了用户标识、课程标识、课件标识、课件单次开始、结束的时间、用户IP。
课件进度记录:用户通过平台进行某一课程所包含课件学习时,记录课件的进度信息,单个用户学习某一课件产生一条记录,主要包括用户标识、课程标识、课件标识、首次学习时间、最后一次学习时间、累计学习时长,累计收集了10万条数据。
课程进度记录:用户通过平台进行课程学习时,记录课程的总体进度信息,单个用户对一门课程的学习,产生一条记录,主要包含用户标识、课程标识、首次学习时间、最后学习时间,完成学习的课件,正在学习且未完成的课件。累计收集了2万条数据。
上述采集指标信息可经过关联统计分析后得出一定的指标数据,可作为用户学习活动分析过程中的重要数据维度,具体如下:
学习时长:用户在平台上针对某类或者某些类课程的学习时间,可以反映他们对学习内容的投入和喜爱程度。
完成率:包括课程完成情况、模块进度等,能够衡量用户完成学习目标的情况。
用户群体资源受众情况:包括按照学历、地域得出不同的所属人群对资源类别的偏好程度。
登录学习频率:用户访问平台的频率可以反映他们的学习习惯和规律。
这些数据通常可以通过平台的学习管理系统(LMS)进行提取,并且可以进行长期追踪,分析用户在不同学习阶段的行为变化。
2.问卷调查
问卷调查是获取定量和定性数据的有效方式,尤其是在研究用户在线学习时,这种方式可以补充平台无法提供的主观意愿信息。通过问卷调查,共回收有效样本数据1817例。围绕问卷对象的个体属性(年龄、性别、单位类别)与教育模式、学习动机、路径、目标、内容、手段、工具及存在的困难等相关元素进行关联,调查结果如下:
(1)教育模式偏好:约40%的受访者倾向于参加线下学习活动,认为面对面互动和现场体验更具吸引力。如参加社区活动和老年开放大学课程。混合学习(线上线下结合)的模式得到较多受访者的青睐(约41%),他们认为这种模式能够提供更加灵活的学习时间和空间。仅有18%的受访者倾向于单纯线上学习,认为学习时间上更为灵活。
(2)感兴趣的课程类型(多选题):健康教育类(约73%)、艺术修养类(约64%)和文化素养类(约57%)的课程被受访者认为最值得学习。此外,受访者还对实用技能类(47%)课程表现出浓厚的兴趣。随着国家智慧助老政策的推进落实,智能手机应用(63%)和短视频制作(59%)的课程也保持着较高的关注度。
(3)学习平台使用情况:受访者希望在举办线上活动的同时可以穿插关联各类丰富的学习资源,并在网页界面元素风格上突显活动主题、系统性的内容展示学习活动与成果分享。
通过分析数据结果可以发现,混合式的学习方式逐渐受到关注并占据主导地位,受访者对课程类型的选择较为广泛,尤其关注健康、艺术、文化素养及实用技能方面的知识。同时,他们对线上平台的改进提出了具体的建议,希望通过平台功能多模块穿插呈现提升用户体验,增强线上学习的吸引力。
3.数据可视化与关键趋势
通过BI工具可以实现数据可视化展示,以图表方式对分析结果进行直观的、迅速的表达。包含丰富的数据维度、指标等,揭示用户行为的动态演变和需求的变化。
资源分析:通过资源基础属性如分类、标签等分析平台资源的涵盖知识领域的情况和不同知识领域在平台资源数量方面的占比。
学习偏好分析:通过学习记录、用户基础信息、资源基础信息的结合,可分析出用户学习不同类型资源频率、人群分类对资源类型偏好、最热门资源排行等情况,如图2所示。
学习人群分析:通过性别、地域、学历、职业、年龄等数据情况来分析平台用户的在各个维度的分布情况,有利于掌握学习用户的总体特征,如图3所示。