机器学习集成模型在乳腺癌诊断的应用研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zxcvbnmzhaowei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计,乳腺癌已经是女性最常罹患的癌症。然而医生很难根据复杂的特征数据人工地确定乳腺肿瘤是否为良性,同时在临床工作中存在大量的诊断错误、效率低下等问题。因此,利用计算机技术支撑乳腺癌的辅助诊断来提高医生工作效率并降低误诊率,控制医疗资源消耗并减缓医疗费用压力具有重要意义。本文以乳腺癌为研究对象,利用机器学习集成模型以及相关知识,研究并设计了一个基于机器学习的乳腺癌辅助诊断模型。具体研究内容如下:首先,利用统计学知识、相关性分析以及CFS算法对威斯康星州原始乳腺癌数据集(WBC)和威斯康星州诊断乳腺癌数据集(WDBC)进行预处理和特征选择,筛选出WBC数据集的9个特征属性以及WDBC数据集的11个特征属性作为模型的输入数据,为构建更高效的乳腺癌集成诊断模型奠定基础。其次,在两个样本数据集上利用Ada Boost M1算法、Bagging算法和旋转森林算法(Rotation Forest,ROF)构建基于29个基分类器的乳腺癌同质集成诊断模型。实验结果显示,ROF算法性能更加稳定和高效,在两个样本数据集上的分类准确率分别达到97.657 4%和97.891%。再次,比较和筛选同质集成模型和单分类器模型,利用投票法(Vote)在两个数据集上分别构建乳腺癌异质集成诊断模型。实验数据显示,构建的乳腺癌异质集成诊断模型在两个样本数据集上准确率分别达到97.803 8%和98.242 5%,分析结果证明了异质集成模型应用于乳腺癌诊断的高效性和可操作性。最后,基于以上研究,结合当前热点问题设计了一个基于机器学习的可扩展的乳腺癌辅助诊断系统,从对系统需求的分析到系统概要设计,完成了从模型算法到应用项目的转化,为加快乳腺癌辅助诊断模型系统的设计与开发应用提供参考。
其他文献
传统粉罐车罐体内部采用布袋式气道结构流化床,流化床的死角区域面积大,导致粉料剩余率高,影响了企业的经济效益。粉罐车的卸料过程是依靠粉罐车自身的管路系统来实现的,手动操作费时费力,同时不能及时反馈罐体内部的压力情况。因此,本文通过研究气道结构对粉罐车罐体结构流化床流化性能的影响,提出了一种新型隔板式气道结构流化床。基于田口方法的理论,建立了关于新型隔板式气道结构流化床结构参数的三因素四水平L16正交
配电网是电力系统主网与广大电力用户连接的重要枢纽,配电网安全稳定对社会的经济发展起着至关重要的作用。随着社会经济的不断发展,我国的电力系统建设也在不断的升级,越来越多的电缆输电线路投入使用。与此同时,电缆配电网故障数量也快速上升,单相接地故障是最常见的故障类型。电网故障后对社会生产,广大人民群众的生命财产造成重大威胁。因此研究电缆配电网单相接地故障特征,提出新的故障定位方法具有非常重要的意义。本文
围绕“电视科普类节目在中学物理教学中的应用”,我主要做了以下工作:采用调查问卷法、访谈法对电视科普类节目在中学物理教学中的应用进行初步分析,发现:学生对电视科普类节目兴趣浓厚,并且对教师将科普类节目引入日常的教学,改善教学过程有着极大的热情,大部分教师在实际教学中使用过科普类节目资源,小部分教师没有使用过,针对存在的问题做出初步分析。针对调查结果及相关理论提出电视科普类节目在中学物理教学中的应用原
在高分辨率遥感影像时代,发展精准化和智能化的遥感影像场景语义理解技术有利于高效提取和挖掘遥感影像信息,为各个应用领域提供高质量知识服务。近年来,在深度学习技术的支撑下,许多遥感影像场景语义理解任务都得到一定发展,比如基础的遥感影像场景分类任务和语义程度更高的遥感影像场景自然语言描述任务。遥感影像场景语义理解需要结合影像内要素的视觉和空间关系信息进行综合分析,而目前基于深度学习的方法往往只是在像素的
目前,我国有近三分之二的城市面临水资源短缺的问题,而水质污染是造成水资源短缺的主要原因,为了有效监测水质污染,需要适时采取水质样本进行定性或定量分析,从而监测水质变化情况、探查污染物来源。而过度依赖人工的传统水质监测方式,造成了一定的人力和财力的浪费,为更好的解决此问题,本文设计了适用于水质监测的采样无人机。针对水质采样器对系统造成较大扰动的问题,提出了加速度估计的控制方法。同时,基于加速度估计,
贫困问题在各国社会经济发展中难以避免。2020年10月,国家民政部在全国开展社会救助改革创新试点工作,提出要积极推动社会救助改革创新,完善有中国特色的分层分类统筹城乡社会救助制度,巩固我国长期以来的扶贫成果,加快建立其长效机制,切实保障最基本的民生底线。因此,如何开展困难家庭调查评估,以及如何构建分层分类多维贫困指标体系,识别出多维贫困家庭并进行精准救助,是现阶段必须关注的重要问题。本文拓展了多维
商业银行内部经济责任审计是商业银行加强对领导干部监督管理,防范经营风险,实现稳健经营的一种内部审计制度,近几年此项工作取得了很大成绩,但仍然存在许多问题,本文提出了应对策略,以利于加强经济责任审计工作。
喷雾钢化工艺理论上比气冷钢化工艺更节能,为了探究喷雾钢化工艺的实际节能效果,本文采用尺寸为40 mm×40 mm×5 mm的平板玻璃进行了气冷钢化和喷雾钢化试验。结果表明:与气冷钢化工艺相比,喷雾钢化工艺在冷却过程中至少节能25.06%;喷雾钢化工艺可以提高玻璃的钢化程度,即破碎后的颗粒数增加了至少8.91%,表面压应力提高了至少12.12%;随着雾载分数的增加,冷却时间减少,节能效果和钢化程度提
随着保险行业全面开放进程提速,外资加速布局中国市场,国有保险行业竞争压力激增。同时银保监局多措并举不断加强和改进保险监管,保险行业由“粗放经营”向“精耕细作”的转型迫在眉睫。在此背景下H公司提出了“提质增效”的人力资源管理经营方针,以质量和效益为经营管理首要目标,进一步激发组织活力,全面提升人力资源配置效率,实现人岗匹配。本文聚焦H公司人力资源配置问题,提出解决问题的思路和办法。本文根据国内外学者
在没有人工智能、互联网还没有发展、信息技术还没有应用的时代,保护个人信息的措施比较容易。只要制定相应的法律规则,进行必要的控制,就可以在很大程度上杜绝信息滥用。然而,随着科学技术的发展,人工智能赋予了个人信息新的概念和内容。个人信息的范围、价值和重要性发生了一系列变化,也给个人信息的安全带来了前所未有的威胁。强大的数据处理能力及其不可控性,以及广泛的个人信息侵权行为,让保护个人信息的需求不断增加。