基于机器学习的医学数据分类算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:sanhaijin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学数据中有两类代表性数据:基因数据与医学影像数据。本文从两类医学数据出发,构建了对透明肾细胞癌的早晚期进行分类的机器学习模型,以及对糖尿病性视网膜病变数据进行分类的深度学习模型。围绕特征提取及模型构建探讨机器学习与深度学习在重大疾病诊断中出现的问题及解决方法,重新设计算法与模型来提高病变诊断的精度,在目标数据集上的分类效果优于现有的最佳方法。透明细胞肾细胞癌是肾细胞癌最常见的亚型。利用基因检测技术,可以对癌症进行分子级认知,获取基因数据。以二代基因测序技术为基础,可以运用机器学习对基因数据进行计算机辅助诊断,但是将机器学习分类算法应用到基因数据时,存在数据噪声大,数据样本少,特征维度高、相关性强等问题,容易引起训练过拟合与维数灾难。糖尿病视网膜病变是糖尿病微血管病变最具代表性的的表现形式。它是糖尿病的一种并发症,是一种特殊的眼底疾病。计算机辅助诊断应用于糖尿病视网膜病变自动诊断中存在眼底影像分辨率高、病变特征小、数据不平衡、数据量小等问题,传统的深度学习模型不适用于糖尿病视网膜病变眼底影像这种高分辨率数据。基于以上背景及问题,本论文具体完成了如下工作:1.提出了一种基于基因数据以及机器学习的透明肾细胞癌早晚期分类模型。本论文改进了基因数据的预处理方法,通过分箱编码,提高了基因表达数据的稳定性和分类模型的鲁棒性,并且本论文设计了一种联合基因选择算法来提取关键基因特征。这种基于基因数据与机器学习的分类模型可以在透明肾细胞癌肿瘤样本分类问题上提取更少的特征达到比现有最优模型更高的预测精度及稳定度。2.提出了一种以深度学习为基础的的糖尿病性视网膜病变诊断模型。本论文结合数据增强与重采样,设计了一种适用于糖网高分辨率图像的深度神经网络模型,使用逐步微调训练策略对网络模型进行训练。最后对不同输入尺度的网络模型进行了复杂度定量分析。该模型在EyePACS数据上比Kaggle糖网病变检测冠军方法的检测性能更好,并且大幅度提升了轻度病变的检测能力。总之,本文系统地展示了机器学习在医学影像分析和基因组数据分析中的应用,以实现疾病的诊断和预测。对于辅助临床决策,提供智能化、个性化的医疗服务有重要的意义。
其他文献
磁流体力学(Magnetohydrodynamics(MHD))是结合流体力学和电动力学的方法研究导电流体和电磁场相互作用的学科。在本文中,我们利用古典能量方法、Galerkin方法、不动点定理、
棉花产业对于国家社会经济建设有着重要的影响,通过不断的探寻棉花纤维检验技术,来实现棉花纤维检验实验技术在整个棉花种植过程中的适用,从而推进棉花产业总产值的稳步增高。棉
C#下的计算机在线打字测试系统作为一个标准化的考试系统,该系统应用的关键是,掌握计算机语言在程序编写过程中需要注意的地方以及程序的正确调试方法,设计计算机在线打字测
社交定向是指个体在社交情境中察觉和注视社会刺激的行为倾向,是社会性注意的内容之一,对自闭症儿童发现社会刺激,促进社会性发展起着重要作用。自闭症儿童对社交活动、肢体
再进入二十一世纪以来,我国的企业在发展的过程中,面临的挑战日益增多。如何在这个竞争日益激烈的市场中生存下去,一直以来都是企业发展的核心问题。企业的财务报表分析工作
本文主要论述在焦化蜡油的加工过程中对那些催化裂化的装置所造成的影响,通过对原料、操作等方面进行一定的分析和调整,然后提升焦化蜡油的加工工艺,使得整个流程得到有效的
背景肺隐球菌病(PC)主要是由新型隐球菌及Gattii隐球菌引起的一种肺部真菌性疾病。主要发生在HIV患者及其它免疫功能低下人群中,也有少部分免疫能力正常者患病。相关报道显示
目的 观察四神丸加味治疗慢性结肠炎的临床疗效。 方法 86例确诊为慢性结肠炎脾肾阳虚证患者随机分为观察组和对照组各43例。观察组内服四神丸加味,对照组内服酪酸梭菌活性
做媒体融合时代的“深度”内容,是锻炼一种“新本领”,而不是把传统媒体时代练就的熟练套路用新媒体的外壳包装一下。
随着生物医学数据采集技术的进步,组学科学产生了越来越多的生物医学数据,可获得的生物实体(如基因、表型、疾病等)关系数据不断积累。Orphanet是目前相对完善的基于疾病的临