基于机器学习的慢性肾病辅助诊断算法的研究与应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:liu0686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前机器学习技术在医疗领域的应用越来越广泛,利用这种技术可以帮助医生及早发现隐匿疾病,正确预测疾病进展,从而降低患者的发病率和死亡率。慢性肾脏病及其主要类型免疫球蛋白A(IgA)肾病是一种发病率高、预后较差的慢性病,探究影响慢性肾病的关键风险因素并及时对患者进行医疗干预有助于减缓甚至是逆转病程进展。本文围绕慢性肾病辅助诊断算法开展研究,主要解决如何利用机器学习技术建立更高效的慢性肾病辅助诊断模型和如何利用机器学习技术建立儿童IgA肾病预测模型两个问题。本文的主要研究成果如下:1.提出基于优化的XGBoost算法建立慢性肾病诊断模型本文采用随机森林模型对预处理后的数据集进行特征选择,选出使模型分类效果最好的5个特征;针对XGBoost算法的参数寻优问题,提出利用遗传和粒子群混合算法进行优化;利用优化的XGBoost算法与支持向量机、极限学习机和K近邻3种算法作对比实验,实验得出基于优化的XGBoost建立的慢性肾病诊断模型性能最佳,准确率、精确度、召回率、F1值和AUC值均为100%,与最新研究成果相比有所提高。2.提出利用随机森林算法建立儿童IgA肾病预测模型通过分析发现IgA肾病的原始数据集正反样本比例接近1:14,数据分布极不平衡,因此本文提出利用Borderline–SMOTE2算法处理不平衡数据集;利用卡方检验方法对得到的平衡数据集进行特征相关性分析;然后利用随机森林与XGBoost、支持向量机、K近邻和极限学习机算法作对比实验,通过实验结果可以得出,基于随机森林算法建立的儿童IgA肾病预测模型性能最佳,准确率为97.01%,精确度为99.22%,召回率为94.76%,F1值为96.93%,AUC值为98.58%。利用Python中的Django框架和HTML文本语言,基于提出的随机森林算法辅助诊断模型建立儿童IgA肾病预测实验系统,达到患者输入指定化验指标预测自身5年内是否进展为终末期肾病的目的。
其他文献
学位
装备试验鉴定工作的发展对装备试验鉴定人才能力素质提出了新的要求。装备试验鉴定人才的能力素质由装备试验鉴定知识、专业技能和隐性素养构成。装备试验鉴定的专门人才应具有装备作战与运用、试验鉴定系统工程、试验设计与评估、试验实施与保障等方面的“军事+管理+技术”复合型知识结构,掌握试验鉴定筹划、试验设计与评估、试验组织实施、试验数据获取等专业技能,并具有爱国奉献、严谨求实和团结协作等方面的素养。
学位
“嵩山”超级计算机系统是我国自主研发的新一代超级计算机,它采用CPU通用处理器+DCU加速器件的国际主流超算异构计算模式,整机峰值计算性能可达100PFlops。为了扩充该平台的科学计算生态,验证量子计算模拟研究在该平台上的可行性,同时推进量子算法的研究与进步,本文选取量子傅里叶变换在该平台上进行模拟实现。本文主要工作及创新点如下:(1)研究了量子傅里叶变换的量子路线图,在CPU集群上进行了代码实
学位
学位
细胞质雄性不育(Cytoplasmic Male Sterility,CMS)是一种受线粒体基因编码的母系遗传性状。在不育系植物中,无法产生或释放有活力的花粉。Ogura细胞质雄性不育系受线粒体基因orf138控制,该基因编码的跨膜蛋白使线粒体受损,引起三磷酸腺苷(Adenosine Triphosphate,ATP)合成、活性氧(Reactive Oxygen Species,ROS)积累等代谢
血管栓塞性疾病现已成为危害人类生命健康的重大疾病之一。目前临床上通常采用静脉滴注纤溶药物(如尿激酶)进行溶栓。但这类药物作用位点宽泛,缺乏血栓特异性,易破坏人体正常的纤溶-凝血系统平衡,产生严重的不可控出血并发症。且溶栓后的血管局部呈高凝状态,活化血小板很可能会再度聚集形成新的血小板血栓,易导致溶栓后血管再栓塞,极大降低溶栓效果。如何实现溶栓药物在血栓局部的特异性递送和可控释放,减少全身出血风险,
近年来备受关注的新型钙钛矿材料因其强的光吸收能力、低的激子结合能、双极性载流子输运特性、长的载流子寿命等优异物理特性且制备方法丰富,在新型太阳能电池、发光二极管和光电探测器等领域展现出广阔的应用前景。然而,在基于钙钛矿材料的光电探测器研究中,通常采用杂化有机-无机钙钛矿材料(Hybrid Organic-inorganic Peroviskites,HOPs)和有机小分子作为光吸收材料和载流子传输
学位