基于大数据的高职院校网络安全态势感知系统构建与应用
作者: 谢东刚 梁耀宁 吴夏青
关键词:大数据;高职院校;网络安全态势感知系统
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2024)28-0078-04
0 引言
在信息技术快速发展的基础上,高校网络作为教学、科研与管理的重要平台,一旦发生网络安全问题将制约高校信息化发展。黑客攻击、病毒传播、数据泄露等事件频发,对高校信息资产安全及师生个人隐私也构成一定威胁。为此,应构建一套高效、智能的网络安全态势感知系统,对基于大数据技术的高职院校网络安全态势感知系统的构建与应用进行深入分析,为提高高校网络安全防护能力提供便利条件,使校园网络环境安全得到有效保障。
1 高职院校网络现状与网络安全问题
1.1 高职院校网络现状
在信息时代,高职院校的网络系统已成为教育工作的重要工具和平台。随着技术的创新和需求的提升,网络系统功能不断拓展,信息处理能力显著提高,子网终端数量快速增长,网络拓扑结构愈发复杂,这导致网络安全管理难度增加[1]。
例如,某高职院校在2019年因网络病毒感染导致校园网瘫痪,影响了在线课程的正常进行。另一个案例中,某校的学生信息系统在2020年遭受恶意攻击,造成大量学生数据泄露,严重影响了学校的声誉和正常运作[2]。这些实际案例表明,高职院校在网络安全管理方面存在明显不足,急需建立有效的网络安全态势感知系统,以防患于未然,提升网络安全管理水平。
1.2 高职院校网络安全问题
高职院校网络安全问题主要表现在以下两个方面:
1) 信息访问权限不清:在设置校园网络系统的用户权限时,通常会根据用户的身份和需求分配相应的账号和密码。然而,随着大数据和云计算技术的发展,用户信息被盗取或泄露的风险增加。例如,某高职院校的一名学生在未授权的情况下获取了教师的账号信息,进而访问了敏感的考试数据。这种情况不仅增加了校园网络信息安全的风险,也提高了信息被盗用的概率。
2) 信息质量管理滞后:在大数据时代,校园网络的连接数和数据量不断增加,但相关的审核机制建设滞后,导致信息质量下降。具体来说,一些高职院校缺乏有效的数据审核和管理流程,导致大量冗余和错误数据的积累。例如,某校在进行学籍管理时,发现系统中存在大量重复和错误的学生信息,影响了后续的统计和分析工作。这种信息质量管理滞后现象,不仅影响了数据的实际价值,还可能带来安全隐患。
2 基于大数据的高职院校网络安全态势感知系统设计
2.1 系统需求分析
系统需求主要分为功能需求与性能需求两大类。1) 功能需求:①网络安全信息提取:全面、及时、准确地搜集安全要素,作为分析依据。②网络安全态势评估:依据提取的安全要素,对网络安全现状与态势进行评估,得出评估结果。③网络安全态势预测:根据评估结果,对未来网络安全态势进行预测,并提供结论。2) 性能需求:①快速响应:系统应具备快速响应能力,特别是在检测到网络安全威胁时需要迅速采取行动。②大规模数据处理:系统应能够处理大规模的网络流量和数据,确保及时检测和响应各种网络攻击。③扩展性:系统应具有良好的扩展性,能够随着网络规模和数据量的增长进行相应的扩展,保持性能稳定。④可靠性:系统应具备高可靠性,确保在各种负载和环境下稳定运行,避免因系统故障造成的网络安全风险。⑤可维护性:系统应设计简洁,易于维护和升级,保证长期运行的可持续性。
2.2 系统设计方案
2.2.1 模型设计
网络安全态势感知模型如图1所示,包括3个部分,由内到外依次为要素提取、态势评估、态势预测。
2.2.2 分层设计
在进行安全态势感知系统设计时,采用分层设计模式,具体分为物理层、网络层和应用层三个层次。1) 物理层:物理层主要负责硬件设备的选择和配置,包括网络摄像头、交换机、防火墙等设备。这一层确保硬件设备的稳定运行,并为上层的网络通信和应用提供可靠的物理基础。例如,选择高性能的交换机和防火墙,可以提高数据传输的速度和安全性,同时部署网络摄像头可以实时监控网络环境。2) 网络层:网络层负责网络通信的管理和维护,主要包括网络拓扑设计、设备组网、路由策略制定等。这一层通过合理的网络架构设计,确保数据在网络中的高效传输和安全。实现方式包括:①网络拓扑设计:采用分层拓扑结构,如核心层、汇聚层和接入层,确保数据传输的高效和稳定。②设备组网:通过配置路由器、交换机等设备,实现各子网的互联互通。③路由策略:制定合适的路由策略,确保数据传输的快速和安全。3) 应用层:应用层是系统的使用和管理层次,面向最终用户和系统管理员,负责用户认证、权限管理和数据处理等工作。具体职责包括:①用户认证和权限管理:通过设置账号和密码、实施多因素认证(如人脸识别)来保证系统使用的安全性。②数据处理和展示:提供用户友好的界面,方便用户进行数据的录入、查询和分析,并通过可视化工具展示安全态势。
2.2.3 技术架构设计
这一系统的技术架构采用三层次模式,即网络安全威胁数据分类汇集和存储、对具有威胁性的数据信息实施大数据分析、进行安全态势预测和预警。
2.3 系统关键技术
这一系统所涉及的技术相对较多,关键技术有数据存储技术、大数据分析技术和态势预测技术。
2.3.1 数据存储技术
基于大数据的高职院校网络安全态势感知系统运行时会接收大量的数据,且不同数据的类型各异,应分类存储。为了满足这一需求,应建立混合式的数据存储仓库,可以对所有结构化、非结构化及半结构化的数据进行标准化存储,使其存储级别达到PB 级[3]。此次设计使用HDFS分布式存储系统,其具有较高的容错能力和吞吐能力。在这一系统支持下,可以基于文件类型将数据划分成多个数据块,并创建与之对应的副本,将副本存储于服务器上,避免数据丢失。
2.3.2 大数据分析技术
大数据分析是整个系统设计的关键环节,其主要包括数据预处理、模型设计、数据分析3个步骤。1) 数据预处理。该步骤主要进行数据的清洗、融合分析和关联分析,得出可以用于继续分析的初步数据。数据清洗主要通过规则匹配及数据标注来实现。数据融合则基于相同特征来实现。数据关联分析时,则需要考虑其来源、时序、交互等特征,构建关系网络图。2) 模型设计。此次模型设计主要包括数值统计模型、算法挖掘模型和攻击树模型。其中,数值统计模型能够对大量数据进行特征统计,并通过同一网络行为进行展示,从而为攻击行为判定提供依据,此次设计使用的数值统计方法如表1所示。算法挖掘模型可以借助现有算法对获取的数据实施挖掘性分析,基于分析结果判定可能存在的风险。此次设计主要使用高度分布算法和基于PageRank的顶底分析算法。攻击树模型基于系统安全可能产生的威胁进行模型设计,并通过树状结构进行展示。其中,树状图的“根部”表示网络攻击的目标;“枝干交汇”位置表示信息交流的节点;“叶”与枝干相连的位置表示攻击时可能使用的模式;“根节点”与“叶节点”之间的连接路径则表示攻击的整个路线及过程[4]。3) 数据分析。数据分析是指系统对经过预处理的数据,借助上述模型和算法进行深度分析。分析形式主要包括离线分析和在线分析两种。分析目的是明确数据的流向、脉络、层次、行为等,并基于分析结果进行安全风险预判。其中,离线分析能够对历史数据进行处理,实现数据的深加工和价值挖掘。此次研究搭建的系统采用ETL技术进行数据分析。
2.3.3 态势预测技术
在此次设计中,为了提升态势预测的精准性,使用BP神经网络技术,对以往的预测结果和数据信息特征进行深度学习,学习之后增强对其的感受能力和判断能力,提升预测的精准性。这样一来,既有利于原有信息的使用,又有利于提升数据库既有结果的优化效果。使用这一技术时,通过对相应特征的反复及多次学习,得到最优结果作为识别标准。学习模型为:
Y = ∂ + βi Xi + ξ (1)
式中:∂为常数项;βi 为回归参数;Xi 为网络安全方面的特征;ξ为随机误差项。
2.4 系统测试与评估
在系统测试方面,主要进行稳定性、可靠性及有效性测试,作为系统设计合理性的评价依据。1) 稳定性测试:通过压力测试和冗余测试分析系统的稳定性。在压力测试中,模拟大量用户同时访问的场景,确保系统在高负载下能够正常运行。冗余测试则验证系统在硬件或软件故障时,能否自动切换到备用设备,保障系统连续性。2) 可靠性测试:主要测试系统在各种负载条件下的运行情况。通过模拟各种攻击和故障场景,验证系统的故障恢复能力和数据完整性。例如,在网络攻击模拟测试中,系统能否及时检测并响应攻击,保护数据安全。3) 有效性测试:评估系统功能的正确性和用户界面友好性。具体包括:① 功能测试:验证系统的各项功能是否按照规格说明书和用户需求正常工作。采用边界值分析和等价类划分等方法,确保每个功能点在不同输入条件下的正确性。②用户界面测试:确保用户界面直观、易用。测试界面元素布局、颜色、字体,以及用户输入的响应和错误处理。③性能测试:确保系统在正常负载下快速、高效地执行任务。通过响应时间、吞吐量和负载测试,验证系统在各种负载条件下的性能。④数据一致性测试:确保系统在处理数据时能够一致地存储和检索信息。通过数据库操作测试,验证数据的一致性。4) 测试结果分析:①稳定性:系统在压力测试和冗余测试中表现出色,能够承受高负载,并在故障时迅速切换到备用设备,保证系统连续性。②可靠性:在各种攻击和故障模拟测试中,系统能及时检测和响应,保护数据安全,表现出高可靠性。③有效性:功能测试表明系统的各项功能均能正常工作,用户界面友好,响应迅速。性能测试显示系统在高负载下也能高效运行,数据一致性测试表明系统能一致地存储和检索信息。
这些测试结果证明了系统设计的合理性。系统不仅稳定可靠,还具备高效的性能和友好的用户界面,满足高职院校网络安全管理的需求。
3 基于大数据的高职院校网络安全态势感知系统应用
3.1 应用实例
此次设计的网络安全态势感知系统已经在24个高职院校中应用,具体硬件和软件组成如下:1) 硬件组成:存储设备:200TB光存储阵列,用于存储大规模数据,保证数据的长期保存和快速读取。服务器:12 台高性能服务器,每台服务器配备多核处理器和大容量内存,确保系统高效运行。网络设备:包括高性能交换机和防火墙,确保数据传输的高速和安全。2) 软件组成:ETL工具:用于数据抽取、转换和加载,保证数据从不同源头到数据仓库的高效传输。Flume:用于大数据的收集和传输,保证数据的实时采集和处理。HDFS:分布式文件系统,提供高容错性和高吞吐量的数据存储解决方案。Hbase:分布式数据库,支持高性能的实时读写操作。Spark:用于大数据的批处理和流处理,提供高效的数据分析能力。3) 处理能力指标:数据处理量:系统每天可以处理2.3亿条数据,确保对大量网络行为数据进行实时监控和分析。离线计算:每天完成120个安全模型的离线计算,支持深度数据分析和历史数据挖掘。规则匹配分析:能够进行33个安全规则库的匹配分析,快速识别潜在的安全威胁。网源图谱分析:同时开展32条数据的网源图谱分析,确保多维度安全态势感知。4) 实际应用性能:在24个高职院校的实际应用中,系统展现了卓越的性能和稳定性[5]。根据反馈,系统在稳定性、可靠性和有效性方面均表现优异,具体情况如下:稳定性:系统在高负载情况下仍能稳定运行,无重大故障发生。可靠性:通过冗余设计和实时备份,系统能够在硬件或软件故障时迅速恢复,确保数据安全和服务连续性。有效性:用户反馈显示,系统提供的安全态势预测结果准确,显著提升了高职院校的网络安全管理水平。
3.2 效果总结
根据24所高职院校的反馈,使用这一系统之后计量其问题发生率,结果如表2所示。由表2可知,该系统稳定、可靠、有效,值得推广使用。
案例一:某高职院校在实施该系统后,成功预警并防范了一次大规模网络攻击,确保了教学和管理系统的正常运行。系统在攻击发生前的几分钟内就检测到异常行为,并及时发出警报,网络管理员迅速采取措施,避免了潜在的重大损失。
案例二:另一所高职院校利用系统的态势预测功能,优化了网络安全策略,将安全事件的发生率降低了50%。通过对历史数据的分析,学校发现并修复了多个网络安全漏洞,显著提升了整体网络安全水平。
案例三:某校在系统上线初期遇到硬件故障,系统自动切换到备用设备,保证了数据的完整性和服务的连续性,用户几乎没有察觉到服务中断。这一事件验证了系统冗余设计的有效性。
通过这些实际应用案例,可以看出系统在提升高职院校网络安全管理水平方面具有显著成效。系统的高稳定性、可靠性和有效性,不仅减少了安全问题的发生,还降低了安全问题带来的影响和损失,为高职院校的网络安全运行提供了有力保障。
4 结束语
此次设计的基于大数据的高职院校网络安全态势感知系统展现了显著的稳定性、可靠性和有效性,显著提升了网络安全管理水平。然而,系统在智能化水平和数据使用能力方面仍有优化空间。展望未来,该系统在高校网络安全管理中具有广阔的应用前景,随着技术的发展,系统将进一步增强网络威胁预测和防范能力,为高校提供更强有力的安全保障。