基于主成分机器学习算法的慢性肝病预测分析

来源 :湖南大学 | 被引量 : 0次 | 上传用户:corbet2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
慢性肝病属于危害性大、流行性广泛、治愈率低、死亡率很高的传染病之一。对于新入院的慢性肝病患者,能及时而准确的评估病情和制定救治方案成为目前亟待研究和解决的紧迫问题。本文根据患者的各项检验指标,分析挖掘并获得较好的预测模型,为医生提供治疗辅助诊断。本文在现有的疾病预测基础上,针对现有预测方法的局限性,首先采用Receiver Operating Characteristic Curve(简称 ROC 曲线)和 Logistic 回归分析来综合判断对慢性肝病诊断价值更高的指标;然后运用主成分分析机器学习算法,对描述慢性肝病多项指标属性项进行线性降维处理;最后结合蚁群算法改进BP神经网络训练学习获得预测模型。本文对原始数据作了一系列预处理设计,提出了基于优选指标和主成分分析的慢性肝病预测模型。实验分析了 125组20维慢性肝病患者的医学检验指标数据项,综合利用ROC曲线以及Logistic回归两种方法得到13维优选的检验指标;通过主成分分析将13维检验指标数据项降至5维合成数据项;采用蚁群算法改进BP神经网络训练学习得到最优模型。经过对原始指标数据集的预处理设计,本文获得了三种不同输入的预测模型,这三种输入分别是:A.20维原始指标数据集;B.基于ROC曲线和Logistic回归优选的13维检验指标数据集;C.基于ROC曲线和Logistic回归优选和主成分分析的5维综合数据集。以这三种数据集作为神经网络的输入作对比分析,得到如下结论:(1)三种模型中C的预测精度最高,较A提高了 15.2%,较B提高了 9.3%;(2)基于ROC曲线和Logistic回归分析综合评价检验指标对慢性肝病的诊断价值,有利于降低信息冗余和干扰;(3)基于主成分分析的神经网络模型降低了预测复杂度以及BP神经网络输入的拓扑结构;(4)采用优化网络结构和蚁群算法改进BP神经网络,大大提高了收敛速度和预测准确度。
其他文献
<正>在实践过程中,在真正履行好党委前置程序时,必须要明晰董事会、党委、经营层的权责权限,即:董事会是决策核心,主要管"干不干"的问题;党委是政治核心和领导核心,主要管"可
利用ANSYS软件对轧机主传动系统的万向联轴器十字轴进行三维有限元分析,在此基础上,以十字轴所承受的最大主应力最小作为追求目标,在ANSYS软件中对其主要参数进行了优化,得出
压缩语段是对内容丰富的语段所提供的信息进行筛选、提炼和整合,改用一句话或者几句话来表达的一种语言运用类试题。近几年高考语文试题一直没有间断过对压缩语段的考查,而且分
本文在介绍金融产业集聚的基本内涵的基础上,深入分析郑东新区金融集聚核心区建设现状,发现其仍然存在金融机构单一化、创新不足、信用环境欠佳等问题。在构建郑东新区金融集
当代美国华人精英参与选举政治的方式可归纳为四种理论模型:选举型和委任型、以华人或亚裔选票为基础和以非华人或亚裔选票为基础、全国型和地方型、象征型和实在型。以骆家辉
冲击成孔灌注桩可以穿越各种复杂土质,特别在有孤石、漂石的土层优势更加明显。在房建及桥梁的基础中使用较多。冲击成孔灌注桩的施工环节较多,需要在较短的时间内快速完成桩
国内民航交通运输行业在最近几年中有了飞快的发展,航空机场移动通信系统(Aeronautical Mobile Airport Communication System,Aero MACS)作为一种新型的高速的可靠的移动通信系统,既可以满足民航空管数据传输和应急的需求,又可以通过此系统为航空公司和机场等单位提供更优质可靠的数据传输服务。Aero MACS是一种基于IEEE802.16e(Wi MAX
从介绍固网智能化对应用系统主要影响入手,阐述了BOSS系统的改造。
民营企业信用担保融资模式无法满足目前企业融资需求,文章以金融危机暴露出信用风险信息不能有效分散与释放的问题为研究契机,顺应市场运行机制,在政府的角色由参与者转变为
最低生活保障制度是我国社会救助体系的重要组成部分,承担着社会安全网的“最后一道防线”的重要职责,对于充分体现我国社会主义制度的优越性、保证社会公平以及实现“十三五”期间脱贫攻坚的目标都具有重要意义。鉴于此,我国在推行事权与支出责任划分改革的过程中,不应当忽视对最低生活保障政府间事权与支出责任划分的研究。本文将事权与支出责任划分的视角转入最低生活保障领域,结合最低生活保障制度的特点及其价值取向,对政