信息化背景下高校数据治理研究现状及趋势

作者: 李迪宏

信息化背景下高校数据治理研究现状及趋势0

关键词:数据治理;CiteSpace;高校;知识图谱;文献计量

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2023)32-0001-03

0 引言

大数据、区块链、5G、人工智能等信息技术的兴起催生了数字化思维、分布式认知、新型人际交往以及知识传播方式,深刻地影响着高校管理模式、治理体系以及人才培养理念。在此背景下,2022年底,世界慕课与在线教育联盟秘书处向全球发布了《无限的可能——世界高等教育数字化发展报告》,报告中明确提到在高等教育完成数字化基础设施及平台建设之后,高校需要通过对教育相关数据的深度挖掘和分析实现全面数字化转型,为个性化、精细化、全程化的智慧教育变革提供支撑[1]。然而,当前我国高校数据治理还存在许多问题及挑战,如数据质量不高、数据共享困难、数据安全问题等。因此,本文借助Citespace 软件,通过知识图谱形式分析和梳理我国高校数据治理的研究现状及热点趋势,以期为相关领域研究提供参考和借鉴。

1 相关概念

对于数据治理的定义,不同的研究机构和研究者从不同视角给出了不同的理解和界定。国际数据治理研究所(DGI)认为数据治理是包含与信息相关过程的决策与权责体系[2]。我国学者张宁、袁勤俭[3]认为数据治理是围绕数据资产展开的系列工作,以服务组织各层决策为目标,涉及有关数据管理的技术、过程、标准和政策的集合。高校数据治理是基于现存高等学校信息化建设过程中暴露出来的数据问题而采取的解决措施。李林等学者[4]认为数据治理是指将数据作为高校资产而展开的一系列标准化工作,是对数据的全生命周期管理,其目标是提高数据的质量。吴信东[5]认为数据治理内容广泛,包含数据安全、数据质量、数据标准统一性和数据资产可利用性,还有技术风险、应用风险。数据治理过程要厘清数据源、数据流向,重新梳理各学院部门的现有数据库,检验这些已有数据的形成和使用的合规性,对数据背后的信息价值进行深度挖掘。余鹏、李艳[6]结合对数据治理学术动态研究分析提出,高校数据治理要统一数据标准、规范数据用户的行为,对数据资产进行科学化管理,持续优化数据质量、全程监督数据安全,从而提高整个学校工作效率,消除数据孤岛。借鉴前人研究成果,综合数据治理的概念及上述分析,本文认为高校数据治理是指通过数据标准化、数据质量和审计管理等技术和方法在保证数据可用性的基础上,对数据进行整理、分析和运用,对数据事务进行规范、控制和协调,从而促进数据价值的发挥和实现。

2 研究方法

2.1 数据来源

笔者通过中国知网中文期刊数据库,以“数据治理”“高校”为关键词,检索相关主题的论文,共得到394条记录。为了提高所选文献的相关度,采用人工筛选的方式,筛除新闻、通告、会议等无关文献后,最终得到有效文献214篇,作为本文分析的样本。

2.2 研究步骤

本文主要聚焦于国内高校数据治理的研究现状和前沿热点。从中国知网选取样本文献后以refworks 的格式导出,经过数据处理后,保存到指定文件夹。借助可视化分析软件CiteSpace6.2.R4,运用文献计量法分析发文时间、年度发文量和作者发文量等指标,分析该领域研究的总体情况;运用可视化分析法对样本文章进行关键词聚类和共现分析,绘制出知识图谱,从而展现出该领域研究的热点及趋势。

3 研究现状

3.1 发文量年度趋势

研究文献的发布时间与发文量可以反映该研究领域在特定时间内的研究总体情况。本文统计了中国知网收录的关于高校数据治理的文献214篇,各年份发文数量如图1所示。可见高校数据治理问题从2015年开始受到关注,但是没有形成热点,到2018年开始发文数量呈现爆发式增长,到2022年发文数量已经是2017年的近9倍。由于统计时间截至2023年7 月,所有2023年的发文数量虽然只有31篇,但预计全年发文数量可能仍超过2022年,可见近7年研究热度持续保持上升态势,这与2018年习近平总书记在致首届数字中国建设峰会的贺信中提出对建设数字中国的展望,随后国家出台的一系列关于数字建设、数据治理的文件有密切关系。

3.2 作者发文情况分析

作者作为领域研究的主体,能够带动学科的发展,引领研究方向,形成重要的学术团体,是推动该研究领域发展的重要动力。通过Citespace软件得到作者共现图谱如图2所示。图谱中共生成177个节点,96条连线,网络密度0.006 1。其中,刘桂锋发表文章最多,共有4篇。刘桂锋、钱锦琳、吴刚发表相关文章有3篇,毛文卉、吴驰、张英伟、刘颖、张吉勇、胡宇航发表相关文章2篇,其余作者仅有1篇文章。通过对高校数据治理的发文作者共现图谱的分析,可以清晰地看出作者之间合作网络密度较低(低于0.1),未能形成有影响力的学术团体。

4 研究热点与发展趋势分析

4.1 关键词共现网络分析

关键词是论文主旨的高度总结和凝练,是研究主题的集中体现。关键词出现频次与研究热度具有正相关关系。通过对高频关键词进行分析,可以把握某领域的研究热点。因此,借助CiteSpace对214篇相关文献进行关键词共现网络分析,Nodetypes选择Key⁃word,阈值设置为T7,其余选择默认设置,得到高校数据治理研究的关键词共现网络图谱,如图3所示。从图3可知,数据治理、智慧校园、大数据、高校、高职院校、数据质量、数据标准、数据挖掘等关键词共现频率较高。

4.2 关键词聚类分析

为了更好地分析高校数据治理研究情况,本文运用Citespace可视化软件绘制出关键词聚类图谱。如图4所示,排名前7位的关键词是#0数据分析、#1数据标准、#2科研数据、#3大数据、#4高校、#5高职院校、#6高等教育。从聚类情况看,数据分析与数据治理联系紧密。数据标准与智慧校园、数据资产、数据服务等关系密切。科研数据主要与图书馆数据关联。大数据主要是与数据挖掘、业务数据关系较多。同时,高校和高职院校也分别形成聚类,可见两类学校都关注到数据治理问题。

4.3 热点变化趋势分析

突变词是指关键词在一定时间阶段内词频和次数发生显著的变化。对突变词进行分析,可以归纳出关键词的变化情况,从而把握大数据治理领域研究主题的变化趋势。突变强度代表某一关键词短期内出现频次的变化和受关注的程度,突变强度越高,代表该关键词变化频率越大,且受关注程度越高。通过Citespace的“突发检测计算工具”显示出突变率前6位的关键词,如表1所示。2015—2019年随着大数据应用的兴起,大数据治理成为研究的热点。2017—2020 年,随着高校数据规模迅猛增加,数据管理成为研究的热点。同时开放科学、数据科学、主数据等领域也日益受到的关注。2021年之后,更多地转向运用数据仓库技术进行高校的数据治理。

5 结论与建议

通过对2015—2023 年国内高校数据治理研究领域的文献进行统计和梳理,运用CiteSpace 软件对关键词共现分析、聚类分析和热点变化趋势分析,可以得到以下结论和建议:

第一,从研究的总体趋势来看,国内高校数据治理研究呈快速发展态势,研究热度不断上升。高校大数据治理相关研究的发文量逐年增长,可知高校大数据治理日益受到学界的重视,有较大的发展空间。从发文的作者和机构看,没有呈现出明显的共现,说明各高校的数据治理多数由高校内部老师完成,跨领域合作较少。

第二,从研究的内容看,高校数据治理的热点主要集中在整体治理体系、智慧校园规划设计以及某业务模块数据治理三个方面。首先部分学者能从学校数据治理整体体系出发,研究了影响因素,并提出了优化策略。例如陈桂香等[7]认为高校数据治理由治理目标、治理主体、治理客体、治理方式四要素构成,需要进一步健全数据治理规则与制度,提升师生数据素养,加强数据全生命周期管理,优化数据治理构件协同方式,以实现数据治理善治的目标。胡水星等[8]从数字化基础设施、大数据治理平台、治理体系保障、教育大数据安全、师生体验反馈这五个维度集成提取出17个关键要素,进而从治理理念、基础设施、核心技术、应用载体和根本保障五个方面阐述了体系的优化路径。董晓辉等人[9]基于高校教育大数据实践困境,依据权变理论,设计了一个高校教育大数据治理的参考框架。其次,数据治理是智慧校园建设的重要基础,通过数据治理规范数据格式标准,提升数据质量,保障数据安全也是数据治理研究的重点。何显文等[10]针对地方高校数据治理中存在的数据质量差、标准不一、数据无法共享等问题,结合智慧校园建设提出数据治理体系建设思路。另外一些文献则对高校某一业务模块的数据治理开展研究。例如刘桂峰等[11]通过调研总结出了高校科研数据治理模型的要素。李琳等[12]就高校图书馆协同参与数据治理的促成因素、数据范围和治理内容进行了研究。范悦敏[13]对高校财务数据治理实践进行了探讨。

第三,在数据化背景下,目前高校数据治理问题日益受到重视,普通高校和高职院校在进行新一轮智慧校园建设中都考虑了数据治理问题,但是目前成功典型案例和范式还不多。未来,我国高校数据治理还需要在政策和技术等方面进一步探索和创新,从宏观角度研究高校数据治理体系,以提高数据质量和价值,为高校的教育决策提供更加科学、准确的数据支持。

上一篇 点击页面呼出菜单 下一篇