基于集成学习的乳腺癌诊断模型研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:R845451732
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,乳腺癌是世界上相对频发的恶性肿瘤之一,它的发展极大的危害了广大女同胞的生命以及健康。常见的乳腺癌检测方法包括X放射、CT、热成像、超声显像等方法,但上述方法不仅需要极高的检查费用,而且也会给患者身体带来较大的损害以及痛苦。假如能有一种成本较低、效率较高而且对患者伤害小的诊断方法应用于早期诊断,便可以降低患者的痛苦以及减少其经济支出。所以,乳腺癌诊断模型的建立便具有很高的实用价值,通过使用已经建立好的乳腺癌检测模型对乳腺癌疑似患者进行检查,从而辅助医生进行临床决策以及提升乳腺癌的早期确诊率。本文基于实验室乳腺癌的三重评估基础上,提出使用机器学习的方法对乳腺癌进行诊断。机器学习的数据集来源于UCI机器学习库中的699组乳腺癌数据,该数据集为University of Wisconsin医学研究中心的相关人员提取的乳腺癌诊断指标,本文通过逐步回归以及PCA主成份分析方法分析该数据集中与乳腺癌相关的10个属性,从而得到与乳腺癌密切相关的特征属性,并保留其作为BP神经网络、决策树、集成学习等机器学习的输入变量。早期的乳腺癌诊断方法不仅给患者带来极大的痛苦,而且诊断费用较高。机器学习在处理比较复杂的问题时候却具有较高的准确率,并且对新样本具有良好的预测效果,从而可使机器训练出来的模型辅助临床医生进行诊断,同时提升乳腺癌的早期诊断率。本文将使用UCI数据集中的乳腺癌诊断数据作为本文的实验数据,其中将683组数据(16组为数据不全的,已去掉)按照实验要求6:4的比例分为训练数据集、测试数据集。然后,分别使用机器学习中的C4.5决策树、BP神经网络以及集成学习等学习模型分别建立相应的疾病诊断模型进行仿真模拟。最后使用测试数据对各个建立好的算法模型进行测试,实验表明各个模型的预测结果与原数据的关联性较强,说明建立的模型预测效果较好。其中基于BayesNet、Logistic、DecisionTable等算法集成的模型不仅比其中任意一个基分类器效果好,而且比常用的BP神经网络、C4.5决策树等算法具有更好的分类能力。所以最后分析比较得出本人提出的集成学习模型更加适用于乳腺癌诊断。
其他文献
介绍了近年来国内外移动式服务机器人的发展现状,对自主移动服务机器人动态环境建模与定位技术、路径规划与导航技术、人机交互技术等关键技术做了浅析,并对目前存在的问题和
1病例:患者,63岁,男性,主因"胸背部撕裂样疼痛8天"于2018-10-19凌晨5时入院,患者缘于8天前休息时突发胸背部撕裂样疼痛,逐先后就诊当地两家医院未能明确诊断,于入院前一天下
会议
近世日本通过政治强制建立起来的身份制度以保障武士、领主和德川幕府的利益为根本旨归,而商品经济的发展却导致了武士的贫困化和豪农豪商的崛起,这种经济实力的逆转使近世日
随着经济的发展,我国工农业用水量不断增加,排放的污水量也不断增加,水环境不断恶化,给水水源水质也变的越来越复杂。对于微污染的给水水源,传统的絮凝—沉淀—过滤—加氯消
<正>高寒地区具有特殊的高原地带性和山地垂直地带性,形成了独特的气侯类型、土地类型、生物资源类型和其它自然生态类型。虫生真菌资源是高寒地区生物资源中的一个重要类群,
会议
萨满神帽为萨满教标志性物件,体现了萨满神树崇拜的各种因素,包括神树崇拜中的女性生殖崇拜,萨满教世界观等,通过对比二者的内涵,能较好地解读萨满神帽结构的宗教含义,萨满教
介绍并总结超晚熟锥栗优株的生物学特性及其配套栽培技术。
中国电影从现代主义表现手法到后现代主义元素的运用,丰富了电影表现技巧,充分地体现了当下中国整个社会文化心理的变迁,将浮躁、喧嚣、冷漠、解构、疯狂消费。娱乐至死的时
<正>多重曝光将白桦林与骆驼叠放在一起,组成了秋季坝E最动人的景色。对于摄影人而言,坝上的深秋是难以抗拒的。梦幻的光影、浓郁的色彩、童话的景致、大气磅礴的场面,它们都
期刊
美术教育是指以对视觉形象的认知、理解和创造为特征,运用艺术作品对人们起到思想教育和道德教育的作用;在美术教育中,最重要也是最基础的就是绘画教育。文章阐述了在现如今