云平台下居家养老智能医疗推荐反馈系统的设计
作者: 张婷婷 卜天然 马莉
摘要:为了构建家庭、社区和机构共同合作的居家养老服务体系,针对老龄化社会中居家养老缺乏全天候照顾的问题,文章对老年人的历年体检数据和智能穿戴设备的实时监测数据进行挖掘与分析,提取健康数据的潜在模式。基于此,设计了一种能够根据各类健康数据推断疾病种类及其发生概率的医疗推荐系统,并通过反馈机制不断优化推荐模型的准确性。该系统能够为居家老人提供个性化、智能化且有价值的健康指导和就医推荐。
关键词:居家养老;机器学习;推荐反馈系统
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2025)02-0007-05 开放科学(资源服务) 标识码(OSID) :
0 引言
随着年龄的不断增长,老年人健康状况日益堪忧,生理机能逐渐衰退,大部分老年人罹患慢性病,自理能力显著下降。国家卫生部门数据显示,我国65岁以上城市和农村老人的平均患病率高出总人口患病率1.8倍。因此,高质量的老年生活需要养老服务的深度介入。
考虑到人口老龄化(即人口年龄结构逐渐向老龄化转变的过程[1]) 的实际情况,在国家的积极引领下,家庭、社区和机构共同合作的居家养老供给体系正逐步形成。目前,约73.6%的老人选择居家养老[2],居家养老服务已成为全球社会养老的主流形式[3-4]。
然而,由于工业社会的发展及双职工家庭模式的普及,许多居家老人不得不面对独居的现状。一方面,忙于工作和照顾小家庭的子女难以提供全天候的照顾;另一方面,身体机能不断退化的老人亟须关注与帮助。为了解决这一矛盾,国家鼓励采用创新方式,通过“互联网/人工智能+健康服务”的发展模式推动居家养老服务的融合发展。
目前,国内外一些学者提出了多种解决方案。例如,文献[5]提出通过线上线下双服务融合,构建一体化闭环服务;文献[6]提出打造“互联网+智能养老”项目,以实时收集生活数据并进行分析与传输;文献[7] 和文献[8]则指出传统医药学正向数字医学转变,新的标准和产业模式正在逐步形成。
1 云平台下居家养老智能医疗推荐反馈系统架构设计
近年来,我国60岁以上老年人口持续增长(见图1) 。根据全国人口普查公报显示,2021年,60岁以上老年人占总人口比重已高达18.9%,我国已进入人口老龄化社会。同时,高龄趋势日益明显,预计到2040年,80 岁以上人口将达到0.56亿[3]。针对老龄化社会中居家养老缺乏全天候照顾的问题,国家提出了“以居家为基础、社区为依托、机构为补充”的养老服务号召。在此背景下,设计云平台下居家养老智能推荐反馈系统具有重要的现实意义。
1.1 系统整体架构
“云平台下居家养老智能推荐反馈系统”旨在为居家老人提供个性化的医疗帮助和指导。通过实时健康数据反馈机制,不断优化算法模型,提升医疗健康推荐的准确性。系统主要收集老人的历年体检数据和智能穿戴设备的实时监测数据(如运动频率、血氧饱和度、心率等) ,对健康数据进行分析挖掘,提取潜在模式,建立疾病预测模型,并通过反馈机制不断优化模型的准确性。基于分析结果,系统提供个性化医疗指导,包括保健手册、慢性病防治指南等,同时在紧急情况下及时发出求救信息。
居家养老智能医疗推荐反馈系统由医疗健康智能推荐反馈系统、服务端系统和移动端App三部分组成,并采用分布式Web框架结构。服务端系统部署在云平台上,可选择阿里云、新浪云等作为部署平台。系统整体架构如图2所示。
1.2 服务端体系结构
服务端系统基于ASP.NET、JSON、XML等技术构建,并调用云平台接口封装为功能库,具体包括:1) 云端数据存储模块;2) 应用服务功能,如数据封装压缩、数据格式解析、信息收发功能等;3) 业务逻辑功能,如统一身份验证、个人权限安全管理、数据读写权限等。服务端系统架构见图3。
1.3 移动端App 框架结构
据调查,老年手机用户群体中,Android手机的使用占比率较高,因此移动端App 前期主要部署在Android 手机上,后期可以适当调整,使其兼容平板等设备。通过调用服务端系统的功能库,实现多种功能。设计过程中应关注数据格式优化、Android版本兼容性等问题,以提升应用性能和用户体验。开发语言可选择Node.js、Python(Django、Flask) 等,数据存储和管理可使用MySQL、PostgreSQL、MongoDB、SQLite等工具,并使用Android Studio作为移动开发平台。
为了提升App性能,可以采用图片压缩、懒加载等技术,通过减小图片大小和延迟加载来提升应用加载速度。同时,可使用代码混淆等技术减小代码体积,提高运行效率。
历年体检数据和智能穿戴设备的实时监测数据涉及用户隐私,App开发需重点考虑数据安全,建议使用OAuth、JWT等技术进行身份认证和授权,以提高隐私信息的安全性。移动端App框架结构见图4。
1.4 医疗健康智能推荐反馈系统
医疗健康智能推荐反馈系统部署在云平台上,首先需要对收集的健康数据进行预处理,包括数据清洗、标准化和整合。随后对数据进行特征化处理,包括特征提取(Feature Extraction,从原始数据中提取有意义的特征,如年龄、性别、BMI、血压水平、运动频率等) 、特征选择(Feature Selection,通过统计方法或机器学习算法选择对预测目标(如健康状况、疾病风险) 影响最大的特征) 、特征转换(Feature Transformation,通过编码、降维等技术进一步优化特征集) 。
在数据处理的基础上,通过以下五类算法寻找关联规则,建立智能健康医疗推荐模型,并通过多次应用建立递归反馈模型,将推荐偏差控制在可接受范围内,优化算法模型的准确性和有效性。智能推荐反馈子系统内部结构见图5。
1) 线性回归。适用于预测连续性的医疗变量,如预测老人的血压、胆固醇、血糖浓度等。通过找到自变量(如年龄、体重、饮食习惯等) 与因变量(如血压、胆固醇、血糖浓度) 之间的线性关系,建立预测模型。
2) 逻辑回归。适用于二分类问题,可预测老人是否患有某种疾病(如高血压、糖尿病、慢性肾炎) ,并预测某种治疗方法的成功率,提供医疗建议。
3) 机器学习算法。使用支持向量机(SVM) 处理高维数据和复杂分类边界,对老人的疾病进行分类,并提示老人的风险分级。使用随机森林集成学习方法构建多个决策树,提高预测准确性和模型的鲁棒性,预测老人的疾病风险并评估治疗效果。使用决策树构建树状结构来分类或回归数据,可用于老人的疾病诊断和治疗方案选择。使用人工神经网络(ANN) 和深度学习(如卷积神经网络CNN、循环神经网络RNN) 分析医学影像(如CT、MRI图像识别) 、基因序列分析等。
4) 聚类分析。可选择K-means和层次聚类等算法,用于识别老人群体中的疾病潜在模式,帮助发现疾病亚型或患者分类,为个性化治疗提供依据。
5) 数据挖掘技术。可选择关联规则挖掘、序列模式挖掘、分类和聚类等,揭示健康医疗数据中的隐藏模式,为医疗决策提供支持。
2 系统设计的关键问题
2.1 医疗健康智能推荐反馈系统的数据集成问题
本系统的数据来源包括老人的历年体检数据和智能穿戴设备的实时监测数据(包括运动频率、活动轨迹、血氧饱和度、心率、压力值、体温、体脂率、睡眠质量等) 。由于数据来源多样化且数据格式不统一,因此需要对这些多样化的大数据进行预处理,以便高效转换到新系统中。具体使用的工具包括Python、R 等编程语言,以及大数据处理框架(如Hadoop、Spark 等) ,以处理大规模数据集,提高数据处理的效率和可扩展性。
2.1.1 数据清洗
1) 统一格式。 由于历年体检数据和智能穿戴设备的实时监测数据来源多样化,同一类型的数据可能存在格式不统一的问题。例如,日期时间“2024年8 月13日下午2点40分30秒”可能有多种不同的表示形式,如“2024-8-13 14:40:30”或“2024-08-13 02PM:40:30”。为便于后续数据处理,需要将日期时间统一为“2024-08-13 14:40:30”格式。类似的处理还可扩展到度量单位,将度量单位统一为国际单位制(SI) ,以确保数据的一致性和可比性。
2) 异常值处理。 来源于老人的历年体检数据和智能穿戴设备的实时监测数据可能存在异常值,这些异常值可能由以下原因导致。① 智能穿戴设备老化:设备超过使用寿命,传感器等内部元器件老化,影响测量数据的准确性。② 电磁干扰:周围环境中的电磁辐射可能干扰智能穿戴设备的传感器,导致测量数据波动或异常。③ 高低温影响:在高温或低温环境下,某些传感器的性能可能下降,影响测量数据的准确性。④ 湿度与压力:湿度和压力的变化可能对传感器的测量产生影响,导致数据异常。⑤ 佩戴方式:用户佩戴智能穿戴设备的方式不正确(如佩戴过紧或过松) 会影响测量数据的准确性。⑥ 运动状态:用户在运动状态下佩戴设备时,身体晃动可能产生额外的噪声信号,干扰测量数据的准确性。⑦ 皮肤状况:用户皮肤状况(如出汗、干燥等) 可能影响传感器与皮肤的接触效果,从而影响测量数据的准确性。
可以通过统计方法(如箱线图、Z分数等) 来识别并处理这些异常数据。以箱线图为例,具体步骤如下:① 计算四分位数:根据排序后的数据,计算Q1(第一四分位数:数据排序后25%位置的数) 、Q2(中位数:数据排序后位于中间的数) 和Q3(第三四分位数:数据排序后75%位置的数) 。② 确定上下边界:根据IQR(四分位距,即Q3-Q1) 计算上边界和下边界。③ 绘制箱线图:在图表上绘制中位数(箱体的中心线) 、Q1和Q3(箱体的上下边界) ,以及上边界和下边界(触须) 。④ 观察触须外的数据点:箱线图绘制完成后,观察位于上边界和下边界之外的数据点,这些数据点即为异常值。
如果异常数据无意义,可以直接删除。如果异常数据需要替换或填充,可使用平均值、中位数或众数填充,也可以采用线性插值或多项式插值的方法进行处理。
2.1.2 数据集成
数据合并:将多来源的医疗健康数据合并到一个统一的数据集中,需要解决数据冲突(如相同字段在不同数据源中的值不一致) 和数据冗余(如多个数据源中存在完全相同的数据记录) 等问题。
数据整合:在合并数据的基础上,进一步整合数据以形成完整的数据视图,包括创建新的字段、计算派生字段(如计算平均值、总和等) 或转换数据类型等。
2.1.3 数据规约
维度规约:减少数据集中的特征或变量数量,降低数据集的复杂度,提高数据处理和分析的效率。维度规约的主要方法包括:主成分分析(PCA) ;小波变换(Wavelet Transform, WT) ;特征集选择(Feature SubsetSelection, FSS) 。
数量规约:用较小规模的数据替换或估计原数据,减少数据量。数量规约的方法主要包括:参数化数据规约(如线性回归、逻辑回归等) ; 非参数化数据规约(如直方图、聚类、抽样、数据立方体聚集) 。
数据压缩:利用编码或转换将原有数据集压缩为一个较小规模的数据集,包括无损压缩和有损压缩两种。
2.1.4 数据变换
需要对分类数据进行编码,以便进行数值分析。例如,可以使用独热编码(One-Hot Encoding) 或标签编码(Label Encoding) 等方法将分类变量转换为数值变量。同时,为了消除不同特征之间的量纲差异和分布差异,需要对数据进行标准化或归一化处理,以提高数据分析的准确性和稳定性。具体方法包括: