基于数据挖掘技术的放疗数据分析与评估技术应用探析

作者: 陈凌宇 邓金城 卢燕妮

基于数据挖掘技术的放疗数据分析与评估技术应用探析0

摘要:为实现不同结构和不同类别放疗数据的统一管理,并提升其二次利用水平,探析基于数据挖掘技术的放疗数据分析与评估技术。该技术以数据挖掘模型原理为依据,结合放疗数据的特点,采用MVC框架作为放疗数据的数据库结构,并且将数据挖掘模型和聚类算法相结合挖掘放疗数据,以此构建放疗数据库;实现放疗数据的统一存储和管理;并且通过用户的主观层面、挖掘模型的客观层面,进行数据挖掘模型的评估,分析其在放疗数据管理中的应用效果。测试结果表明:该技术具有较好的放疗数据库的构建效果,数据库中相同数据类别的离散度常数结果均在0.025以下;能够实现数据库中放疗数据的解析。

关键词:数据挖掘技术;放疗数据;分析与评估;模型评估;数据特点;聚类算法

中图分类号:TP391        文献标识码:A

文章编号:1009-3044(2023)25-0064-03

开放科学(资源服务)标识码(OSID) :<G:\飞翔打包文件一\电脑2023年第二十五期打包文件\6.03xs202325\Image\image1.jpeg>

0 引言

放疗数据是恶性肿瘤治疗过程中产生的相关数据,其产生的途径主要分为3方面,一是由医院信息管理系统、电子健康记录以及个人健康记录中产生;二是由放射治疗计划管理中产生;三是由医学影像设备产生[1]。这些放射数据中包含患者所有的个人信息、诊断结果、治疗记录以及用药和住院治疗等多个方面的详细信息[2];这些信息结构复杂,类别较多,包含医学影响、诊断记录、病历档案等,整体可分为结构化信息、半结构化信息以及非结构化信息[3],具有显著的多源异构特性,因此在一定程度上呈现相互孤立、且分散程度较高等分布状态。除此之外,放疗数据存储于不同的治疗科室内,导致医生在进行临床应用时,无法全面掌握数据情况,到时数据的可利用程度较低[4]。近几年恶性肿瘤的临床治疗病例显著增加,各大医院对于该类患者进行治疗过程中,均需依据放疗数据完成,因此,导致各大医院对于放疗数据的管理需求也逐渐增加,如何有效、全面、合理的实现放疗数据的整合和管理[5],对于患者情况的掌握以及其放疗数据的分析具有重要意义。

数据挖掘技术属于人工智能领域中的一项重要的大数据处理技术,该技术具有良好的大数据处理能力,可获取海量数据中的隐藏信息。并且该技术具有不同类型数据的挖掘和处理能力[6],能够较好地完成具有多源异构特性的分析和处理;除此之外,其还能够完成数据库的挖掘。因此,本文针对放疗数据的管理需求,提出基于数据挖掘的放疗数据分析与评估技术,并对该技术的应用情况展开相关分析和测试。

1 基于数据挖掘技术的放疗数据管理

1.1 放疗数据挖掘模型原理

由于放疗数据为多源异构数据,数据的类别较多、结构较为复杂,因此,本文为实现放疗数据的全面、有效管理,主要依据基于数据挖掘模型进行放疗数据的挖掘,该模型结构如图1描述。

数据挖掘模型在进行放疗数据挖掘时,可以对各个部门中的患者档案、电力病例以及相关治疗记录文档和表格进行深度挖掘,并且对挖掘和抽取的放疗数据进行加载和转换处理后,实现放疗数据的高效整合[7],以此构建统一的元数据库。以元数据库为基础,利用数据引擎获取其中的放疗数据和信息,并且通过可视化界面,将所需的放疗数据呈现给用户。通过该模型即可有效解决临床中放疗数据的分散现象,实现放疗数据的整体化管理,提升放疗数据的管理水平。

1.2 基于数据挖掘技术的放疗数据挖掘

由图1可知,放疗数据库的构建是以元数据库为基础,因此,本文为保证放疗数据库构建后数据的调用能力以及数据完整性,文中采用MVC框架作为放疗数据的数据库结构,该框架主要分为模型层、视图层以及控制层,通过3层之间的相互支撑,完成数据库基础结构的构建。其中,模型层是数据库框架的基础,其主要作用是为数据库构建提供相应功能支撑,保证放疗数据业务处理流程满足相关标准和规则;视图层主要是用于实现数据库的可视化和交互,使用户能够查看数据库中的数据结果;控制层属于数据库框架中的中间层,主要用于另外两层之间的数据传送和操作的协调和控制。

采用数据挖掘技术进行放疗数据挖掘时,以元数据库为基础,利用数据挖掘引擎获取其中的放疗数据,形成不同主题的放疗数据集,实现放疗数据库构建。本文为保证放疗数据的挖掘效果以及数据库的质量,在进行放疗数据挖掘和存储过程中,主要采用聚类算法完成。

如果放疗数据聚类质心点用[akKk=1]表示,其中[K]表示质心点数量,如果任意一个放疗数据样本用[e]表示,其所属类别用[ci]表示,其计算公式为:

[ci=argminime-αi2] (1)

式中:[me]表示所有质心数量;[αi]表示质心,属于同一个放疗数据样本,其计算公式为:

[αi=e=1Xcimee=1XK] (2)

式中:[X]表示放疗数据总样本。

为避免挖掘的放疗数据存在储过程中发生畸变,文中引入畸变函数对挖掘的放疗数据进行约束,其计算公式为:

[J(c,α)=e=1Xme-αce2] (3)

式中:[J(c,α)]表示距离平方和,对应样本点和其质心之间,保证其取值为最小结果,同时完成[(c,α)]的收敛,以此获取放疗数据局部最优结果。在此基础上,依据概率强度和关联重要程度,提升放疗数据库的应用效果,确保放疗数据的存储和管理效果。

1.3 数据挖掘结果评估

依据上述小节完成放疗数据的挖掘后,为衡量挖掘结果对于临床的应用效果,挖掘的放疗数据是否为有价值数据,文中直接对数据挖掘结果进行评估。该评估主要从两个方面进行,分别为用户的主观层面以及挖掘模型的客观层面;前者主要通过3种标准进行衡量,分别为易于理解程度、数据有效程度、潜在价值情况;后者则通过主观度量进行评估,该度量需具有放疗数据特征给定能力,同时满足已经定义的信息需求。

本文在进行挖掘模型客观层面评估时,度量信息能够通过3个层次的度量,进行数据挖掘模型的评估,分别为基本度量、派生度量以及指示器。挖掘模型的评估度量构造模型如图2描述。

对数据挖掘模型在进行放疗数据挖掘后,会获取若干条模式,其中也会存在一定的无价值模式,因此,对挖掘模型的挖掘结果进行评估,是保证数据挖掘结果的有效手段;依据评估结果可去除没有价值的模式,并且提升数据挖掘的效率。

2 应用结果分析

为分析数据挖掘技术在放疗数据分析与评估上的应用效果,以某医院的放疗数据作为实例分析对象展开相关测试,测试主要包含两个方向:一是放疗数据库构建效果,二是放疗数据分析效果。

放疗数据库构建效果对于放疗数据的应用效果存在直接影响,文中采用离散度常数作为衡量指标,用于分析数据库中,同类放疗数据的差异性,该指标的取值范围在0~1之间,越接近1表示数据库的构建效果越差。该指标的计算公式为:

[σ2=1n-1j=1n(ij-mean)2] (4)

式中:mean表示加权平均数;ij表示放疗数据元素的一个项。

依据该公式获取本文技术进行放疗数据库构建后,在不同的数据类别下,随着数据量的逐渐增加,[σ2]的测试结果,如表1描述。

由表1结果可知:在数字化结构数据、影像数据以及结构化数据三种数据类别下,随着数据量的逐渐增加,采用本文技术进行数据挖掘后,构建数据库,数据库发的离散度常数[σ2]结果均在0.025以下,表示同类放疗数据之间的差异性较小,能够有效完成放疗数据挖掘,数据库的构建效果较好。

为验证本文技术应用后,对于放疗数据的分析效果,随机抽取一条数据库中存储的放疗信息,并对该信息记性分析,获取分析结果如图3所示。

由图3结果可知:本文技术应用后,能够实现数据库中放疗数据的解析,并获取解析结果,该结果中包含患者的CT检查数据以及部分的治疗信息。因此,本文技术具有放疗数据分析能力,能够精准掌握数据库中放疗数据详情。

3 结论

数据挖掘技术对于大数据的处理具有显著优势,放疗数据包含多个类别的数据信息,对于数据的利用、患者情况分析等均具有一定影响。因此,为保障放疗数据的二次利用,同时分析数据挖掘结果的可靠程度,本文探析数据挖掘技术在放疗数据分析与评估上的应用情况。以数据挖掘模型为基础,并依据该模型挖掘放疗数据,构建数据库,实现放疗数据的统一封装和管理,并且评估挖掘效果,确保放疗数据的管理效果。

参考文献:

[1] 谢彬.数据挖掘与分析在医疗业务中的应用[J].电子技术与软件工程,2021(15):181-182.

[2] 于慧,王尊博,张洋.医疗产业发展视角下数据挖掘技术在医院信息分析中的应用[J].中国市场,2021(1):195-196.

[3] 牟德武,孟朔,陈茂山,等.基于SEER数据库分析放疗对初诊Ⅳ期保乳术后乳腺癌患者预后的影响[J].中国医学工程,2021,29(10):6-11.

[4] 庞倩,蒙绪君,肖钦晓.基于数据挖掘分析FAM64A在肺腺癌中的表达模式和作用机制[J].东南大学学报(医学版),2022,41(5):629-636.

[5] 曲超,张冰冰,姜楠,等.基于数据挖掘和网络药理学的早期DN用药规律及机制分析[J].沈阳药科大学学报,2021,38(5):498-512.

【通联编辑:闻翔军】

上一篇 点击页面呼出菜单 下一篇