基于大数据技术的智慧红旗渠纪念馆建设问题研究

作者: 刘海 刘明阳 王晓钰 刘世超 苏云飞 石悦 王星祎

基于大数据技术的智慧红旗渠纪念馆建设问题研究 0

摘要:信息技术的发展使得人们了解博物馆相关信息的途径已经发生了根本性的改变,同样也使得博物馆在智慧化建设过程中充满了无限可能。不同博物馆属性不同,特色也不相同,因此智慧化博物馆的建设要以博物馆自身为基础,以信息技术为支撑,以受群众欢迎为目的进行详细研究。而在以数据为基础的信息化时代,智慧博物馆的建设首先要考虑的便是数据的处理和规划问题,大数据技术以其强大的数据处理能力可以满足不同需求的数据分析。该文以红旗渠纪念馆运行中的售票数据、检票数据、游客游览调查数据、游客游览过程数据和游客网络评论数据为基础,以大数据技术中的数据采集和数据预处理为支撑,以受群众欢迎为目的对每一种数据来源都进行了详细的数据现状分析和数据处理策略分析,并对红旗渠智慧化建设提出了相应的建设意见。

关键词:大数据技术;红旗渠纪念馆;智慧博物馆;数据采集;数据预处理

中图分类号:TP311        文献标识码:A

文章编号:1009-3044(2022)11-0011-04

随着人类社会和科学技术的不断发展,博物馆从传统形式向数字博物馆转变,这是科技的重大进步,为广大民众的生产、生活提供了极大的便利[1]。而博物馆从数字化到智慧化的进一步提高也已成为目前的主流发展趋势,这是科技和人文发展的必然结果。红旗渠纪念馆是为纪念六十年代林县人民为了改变缺水旧面貌,发扬“自力更生、艰苦创业、团结协作、无私奉献”的精神,修造红旗渠这一伟大创举而建立的[2]。对红旗渠纪念馆进行智慧化建设研究对于扩大红旗渠的影响力,传播红旗渠精神具有十分重要的作用。

1 研究背景与意义

博物馆是征集、典藏、陈列和研究自然和人类文化遗产实物的场所,对馆藏物品分类管理,为公众提供知识、教育和欣赏的文化教育机构、建筑物、地点或者社会公共机构[3]。纪念馆是博物馆的一种特殊类型,它具有一般博物馆的基本性质,即“博物馆是科学研究机关、文化教育机关、物质文化与精神文化遗存或自然标本的主要收藏所,和基本任务——为科学研究服务,为广大人民服务”[4]。作为传统文化中最为精髓的一部分,博物馆在文化传播与文化养成方面具有十分重要的作用。然而通过笔者的调查发现,在受调查的117人中,有61人近一年没有去过博物馆(包括纪念馆) ,占比为53.51%。究其原因,笔者通过调查发现,在受调查的117人中,通过抖音、快手、微视等短视频平台了解博物馆相关信息的占42.11%,通过微博、朋友圈和QQ空间等共享数据平台了解博物馆相关信息的占35.09%。由此可见,随着信息化技术的发展,更多的人更愿意通过信息化时代的最新产物去了解和深入博物馆的相关信息。反过来,对于博物馆方而言,通过信息化时代的最新产物,博物馆方面也可以高效和准确地分析出游客的游览行为,继而改善场馆建设。因此,智慧化博物馆的建设要以博物馆自身为基础,以信息技术为支撑,以受群众欢迎为目的进行研究。

而在以数据为基础的信息化时代,智慧博物馆的建设首先要考虑的便是数据的处理和规划问题。对于红旗渠纪念馆而言,笔者通过调查发现,红旗渠纪念馆的主要数据来源包括自身产生的数据和相应的网络衍生数据。在数据特点上,具有数据格式多、数据相关性差和数据价值密度低等特点。因此,面对如此纷繁复杂的博物馆数据,如何做好数据的处理和规划就成为智慧化博物馆建设研究的关键问题。

2 研究思路

大数据技术拥有的强大的数据处理平台以及超高效率的数据处理技术实现了对大规模数据的实时统计、分析以及处理、预测[5]。就大数据数据分析工作而言,常用的大数据计算模式主要有批处理计算、查询分析计算、图计算、流计算、迭代计算、内存计算等[6]。不同的计算模式所分析的数据种类是不尽相同的,例如批处理计算模式主要分析的是大规模的数据,流计算模式主要分析的是实时的数据,并可以实时地得出有价值的结果,图计算主要分析的是大规模图结构数据。因此,尽管说红旗渠纪念馆的数据来源纷繁复杂,但是大数据众多的计算模式为其智慧化建设提供了最契合的解决方案。因此,针对红旗渠纪念馆运行过程中产生的数据采用大数据技术完全可以实现数据的处理与规划。

而从大数据数据分析全流程的角度来看,大数据技术主要包括数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化和隐私保护等几个层面的内容[7]。并且这几个层面是存在一个先后发展和相辅相成的关系,也就是说,只有提前完成了数据的采集和预处理工作才能进行数据的存储和分析工作,否则就相当于是无本之木、无水之源。也只有提前做好做完备数据的采集和预处理工作,才能为后续的大数据处理和可视化提供坚强的支撑。同时,数据的采集和预处理工作也要根据数据分析和可视化的反馈结果进行适当调整,以使得整个大数据系统更加完善和符合实际的需求。鉴于大数据数据分析全流程的复杂性,本文主要就智慧化红旗渠纪念馆的大数据数据采集和预处理工作展开研究。

3 研究概述

通过笔者对红旗渠风景区的调查发现,在受调查的114人中有76人没有去过红旗渠风景区,占比为66.67%,调查结果图如图1所示。在调查问卷中,笔者并没有指出红旗渠纪念馆为红旗渠风景区的组成部分,而是独立地设置了是否去过红旗渠纪念馆这个问题,调查结果显示在同样受调查的114人中,有84人没有去过红旗渠纪念馆,占比为73.68%,调查结果图如图2所示。也就说在去过红旗渠风景区的38人中,有8人次没有去过红旗渠纪念馆,占去过红旗渠风景区人数的比例为21.05%。

在进行调查结果分析之前,首先对红旗渠纪念馆做一个简单介绍,红旗渠纪念馆是隶属于红旗渠风景区的一部分,游客可以凭借所购红旗渠风景区门票实现对红旗渠纪念馆的免费游览,但是红旗渠纪念馆与红旗渠风景区的青年洞、创业洞和一线天等依水渠而建的景点(以下简称红旗渠) 并不在同一个地方,根据笔者的实地考察,两者之间的距离差不多有20公里,自驾的话需要30分钟左右。虽说两者不在同一个地方,距离较远,但是按照目前的道路规划来看,进入红旗渠风景区纪念馆是主要途径。那么究竟是什么原因导致去过红旗渠的游客没有再去红旗渠纪念馆参观呢?根据笔者自身经历和现场与游客交流,结合与红旗渠纪念馆相关工作人员的沟通,最后进行相关资料查询得出两点大致的结论:

(1) 依靠红旗渠建立的景点太多,而且部分景点知名度非常高,像青年洞景点,已经成为游客打卡拍照必去的圣地,所以很多游客会直奔红旗渠,而把红旗渠纪念馆放在备选项。红旗渠本身又是依山而建,道路崎岖,容易使人在游览完后,出现时间不够用、精力不足等情况,继而放弃对红旗渠纪念馆的参观。

(2) 红旗渠纪念馆本身与其他博物馆(包括纪念馆) 相比,没有明显地领先于其他博物馆的特色。其实这也是当代纪念馆存在的一些共性问题,纪念馆一般是为纪念某历史事件或者某历史人物而建立的能弘扬和传播相关精神的博物馆,相比较某些存在国宝级或者珍稀级文物的历史类博物馆,往往对游客的吸引力会有所折扣。

针对上述问题,笔者认为要想提高红旗渠纪念馆对游客的吸引力,增加红旗渠纪念馆的访问量和游客喜爱度,最根本的是要依靠现有数据,经过大数据分析技术,结合实际情况,从内部建设展开。下面本文将就红旗渠纪念馆现有的内部数据进行数据现状分析,并根据分析结果展开大数据数据处理策略研究,最后提出相关的实质性智慧化红旗渠纪念馆建设意见。

4 研究内容

4.1 售票数据

(1) 数据现况分析

经笔者实地调查和与红旗渠纪念馆相关工作人员进行沟通,无论是直接去红旗渠现场购票,还是通过网络购票,红旗渠纪念馆采用的都是实名制购票。通过实名制购票对于游客的购票日期、年龄、性别、出生地都会有一个详细的数据统计。但是由于网络购票平台较多,红旗渠纪念馆方目前并没有展开对于所有的购票数据整合。

(2) 数据处理策略

通过整合购票信息后各字段的大数据分析,红旗渠纪念馆可以在游客游览前根据分析结果确定购票时间段,不同地区不同年龄段人群的购票方式等数据。而实现这一技术不难,因为这些数据都是存储于红旗渠纪念馆相关售票系统数据库中的静态结构化数据,要完成这一工作,主要进行两方面的工作,一方面需要从不同的数据库中采集和汇总相关售票信息,另一方面需要对采集到的信息进行预处理,也就是按照实际需求,把不同数据库中的数据整合成统一包含购票日期、年龄、性别、出生地、购票方式等字段的分布式文件,以供后续的Spark或者Hadoop大数据批处理技术进行分析。

(3) 建议

首先,红旗渠纪念馆应该增设相应的大数据售票分析系统。其次,根据系统分析结果,红旗渠纪念馆方应进一步采取行动以发挥优势,弥补劣势,例如根据年龄段分析结果增加符合劣势年龄段的活动,根据售票日期集中段开展淡季打折活动。

4.2 检票数据

(1) 数据现况分析

无论是直接去红旗渠现场购票,还是通过网络购票,其在进入红旗渠、红旗渠纪念馆等景点时,都需要通过入口的闸机进行检票。检票方式多种多样,可以是身份证、纸质票上的二维码,也可以是网络购票的二维码,但是无论采取何种形式,其都是与个人身份信息一一对应的。目前无论是红旗渠还是红旗渠纪念馆都已经建立好了相应的检票系统,通过检票系统可以分析出一年中的旅游人数淡旺季、年龄段组成、地区组成、购票方式组成、性别组成等与个人实名信息相关的分析结果。同时根据游客进入各个景点的时间可以分析出每天旅游的高低峰时间以及参观各景点的人数。检票系统也可以反映出每天参观红旗渠和参观红旗渠纪念馆的人数是否一致,存在多少比例的差距等信息。但是根据笔者的实地调查,发现红旗渠纪念馆的检票系统功能有待进一步提高,首先检票系统目前的作用就是检票和对检票数据进行统计分析,功能较单一;其次,红旗渠纪念馆只有入口闸机,没有出口闸机,并不能真实地反映出纪念馆内游客的游览情况。

(2) 数据处理策略

如若把检票系统与售票数据结合起来,那么就可以进一步分析售票人数与检票人数的差异,可以统计出红旗渠风景区的退票率,根据退票人数各个字段的属性,红旗渠风景区各景点可以采取相应的改进措施以减少退票率。同时根据售票时间和检票时间可以进一步分析出游客从购票到游览的时间差,这对于红旗渠风景区各个景点提前,尤其是在旅游黄金期做好游客接待工作和提高游客满意度是非常重要的。而实现这一技术只需把售票系统和检票系统的数据进行统一整合,在数据处理同样采用对应的批处理大数据技术Hadoop或者Spark即可。

对于红旗渠纪念馆而言,如能在纪念馆出口处放置跟入口处一样的检票闸机,那么就能分析出各类具有不同属性的游客游览红旗渠纪念馆的总时长,例如可以分析出不同年龄段的人群在馆内参观的时长,时长其实可以从某种层面反映游客的喜爱度,这对于纪念馆做出相应的改进和调整以适应多年龄段人群的喜爱是非常重要的。同样放置出口闸机也可以对馆内游客数量进行实时控制,这对于红旗渠纪念馆实时控制在馆参观人数是非常重要的。而要实现这一技术并不难,关于数据采集只需要在原有检票系统中加一个出口闸机即可,关于数据的分析也同样采用批处理大数据技术Hadoop或者Spark即可。

(3) 建议

首先,红旗渠纪念馆需要把检票系统和售票系统进行一个有效的整合,在实际中完全可以把售票系统统一嵌合到检票系统中,并根据上述数据处理策略结果采取相应的改进措施;其次,红旗渠纪念馆需要在出口处设置一个跟入口处一样的闸机,把出口闸机数据和入口闸机数据进行一个系统的分析,并根据上述数据处理策略结果采取相应的改进措施。

4.3 游客游览调查数据

(1) 数据现况分析

经笔者实地调查,发现红旗渠纪念馆并没有在明显的位置针对游客游览过程中的问题进行问卷调查的设备或者纸质调查问卷。通过设置相应的问题,如能在游客游览过程中或者在游客游览结束后对游客游览情况进行调查,根据调查结果可以进一步优化场馆建设,改进馆品陈设,使红旗渠纪念馆更受大众欢迎和喜爱。

(2) 数据处理策略

在游客游览调查方面,笔者认为可以采取以下措施采集相关数据。首先是传统的纸质调查问卷,设置好关于纪念馆的游览调查问卷,问卷中问题不能太多,字体不能太小,一张纸单面足矣。打印好后,专人在出口或者某个区域负责进行问卷调查,最后再定期对问题进行计算机汇总。在数据处理方面,因在数据汇总过程中需人为操作,所以可以设置为规范化的结构化数据以供批处理大数据技术Hadoop或者Spark处理。虽然纸质调查的方式简单,但是存在浪费纸质资源、耗费人力等缺陷,而且并不是所有的游客都会参与问卷调查,因此数据收集具有局限性。

上一篇 点击页面呼出菜单 下一篇