论文部分内容阅读
虚弱症是由人在躯体功能、心理精神、社会保障等方面存在的缺陷,导致身体多系统结构、多器官组织储备功能下降到接近阈值时的一种状态或一组综合征。虚弱症具有高并发和高风险特点,会造成患者的诊疗周期延长,治愈率降低,以及死亡率上升等不良结果。现有临床医学研究表明,疾病会促进患者虚弱程度的提升,而虚弱症会反作用于疾病的治疗,造成病情的恶化。通过对虚弱症的研究,发现其与现有疾病之间的关联关系,可以辅助实现对疾病的预防与控制。因此,虚弱症与疾病关联关系具有重要的研究与应用价值。现虚弱症的相关研究多局限于利用基于统计学方法的虚弱量表建立数据基础,在应用过程中因缺乏客观性导致结果误差率较高,而运用机器学习、数据挖掘等技术对其建模的研究较少。本文以心血管疾病为例,采用无监督学习技术研究了虚弱症的度量问题和虚弱症与疾病症状的关联分析问题。本文所取得的主要成果如下:(1)提出了基于MGMM(Multiple Gaussian Mixture Model,多重高斯混合模型)的心血管患者虚弱程度度量模型。该模型利用KPCA(Kernel Principal Component Analysis,核主成分分析)提升患者数据的线性相关性,利用MGMM提升度量患者虚弱程度的准确率,其中MGMM为多重迭代计算的高斯混合模型。与基于虚弱量表的度量方法相比,本文提出的基于MGMM的心血管患者虚弱程度度量模型,其误差率控制在2.9%左右,正确率提高了约5.6个百分点,同时运行效率提升了约13个百分点。此外,本文提出的虚弱程度度量模型为虚弱症与心血管疾病关联关系的研究提供了精准的数据基础。(2)在提出的基于MGMM的虚弱程度度量模型基础上,本文提出了一种基于改进Apriori算法的虚弱症与心血管疾病关联规则模型。考虑到基本Apriori算法虽能提取数据间潜在的关联规则,但存在效率和可靠性方面的缺陷。模型引入提升率和Hash表,分别改进Apriori算法的剪枝策略和数据存储结构。实验结果表明,与采用基本Apriori算法的模型相比,本文提出的改进模型在运行效率方面提升了约60个百分点,并通过对关联规则的提取验证模型的有效性。综上所述,本文提出的模型在稳定性、准确度和效率等方面,较其对比模型均表现出更优的性能,证明了本文提出模型的可行性。同时,本文提出的模型具有一定的可扩展性,为研究虚弱症与其它疾病间的关联模式提供了方法参考。