【摘 要】
:
近些年来,预防乳腺癌的发生已经成为中国肿瘤防治任务的重点,如果建立出具有高准确率的乳腺癌智能诊断方案,就可以提高乳腺癌的早期发现率,降低女性患者死亡率,为中国医疗事业提供有效的帮助与支持。本文采用山西省乳腺癌患者生存状况的数据,通过分层抽样按照8:2的比例将数据集划分为训练集和测试集,在训练集上基于山西省乳腺癌生存状况的数据,构建logistic回归分析、决策树、支持向量机以及BP神经网络的诊断模
论文部分内容阅读
近些年来,预防乳腺癌的发生已经成为中国肿瘤防治任务的重点,如果建立出具有高准确率的乳腺癌智能诊断方案,就可以提高乳腺癌的早期发现率,降低女性患者死亡率,为中国医疗事业提供有效的帮助与支持。本文采用山西省乳腺癌患者生存状况的数据,通过分层抽样按照8:2的比例将数据集划分为训练集和测试集,在训练集上基于山西省乳腺癌生存状况的数据,构建logistic回归分析、决策树、支持向量机以及BP神经网络的诊断模型,通过不断调节各个诊断模型的参数,找到每个分类器的最优诊断模型,之后在测试集上进行测试并预测,最后根据准确率、ROC曲线下面积、查准率、召回率以及F1分数等指标来评价诊断模型的诊断效能。为了更加稳健的对比这四种分类模型的诊断效能及其稳定性,对各种分类模型都进行了十折交叉验证。通过比较发现:对于单一分类器诊断模型来说,诊断效能最好的是决策树模型,其预测正确率达到了 0.86,该诊断模型对于生存状况为存活(0)和生存状况为死亡(1)的样本预测的正确率都比较高;其次是logistic回归分析模型,其预测准确率为0.81,再次之是BP神经网络模型,其预测准确率为0.77,最差的是支持向量机模型,预测准确率仅有0.71,但是这三种分类模型只对于生存状况为存活(0)的样本预测的正确率高,而对于生存状况为死亡(1)的样本预测的正确率不太高。因此,本文选择了预测准确率最高的决策树和logistic回归分析诊断模型,通过对这两个分类器的预测概率进行加权求和,构建了一个分类器决策融合模型,使得该模型的预测准确率达到了 0.87,并且该诊断模型对于生存状况为存活(0)和生存状况为死亡(1)的样本预测的正确率都比较高。
其他文献
伴随着5G信息时代到来,科技领域和军事领域发生了巨大的变革,为了适应当今社会发展需求,对新型电磁吸波材料提出了新的挑战,新型的电磁吸波材料应具备“质量轻、厚度薄、频带宽、吸收效果强”等特点。本文利用微米尺度的玻璃纤维(GFs)作为增强体,纳米尺度的碳纳米管(CNTs)、还原氧化石墨烯(RGO)和导电聚吡咯(PPy)作为吸收剂构筑碳纳米材料/GFs多尺度增强体。通过电泳沉积、层层自组装和原位聚合等方
随着零件的智能化、集成化与标准化设计的迫切需求,轴类零件作为机械装备中的重要非标件,设计过程已从传统的设计模式走向自动化的设计。但由于轴类零件设计过程随使用工况考虑的设计因素不同,使得整个设计过程十分繁琐,涉及的知识众多,对设计人员的专业度要求十分高。虽然,一些商业软件中包含了轴类零件设计所需的各个模块,但是对复杂变化工况下轴类零件的设计质量难以估量,还需要专业人员的经验判断,以弥补实际工况模拟误
伽马暴是宇宙中最剧烈的电磁爆发现象,这一现象包括爆发时的瞬时辐射及此后持续较长时间的余辉辐射,根据爆发时间可分为长伽马暴与短伽马暴。一般认为火球模型可以较好地解释伽马暴的物理机制,在这一模型中,瞬时辐射为伽马暴前身星发出的喷流的内部激波辐射,而余辉辐射是抛射物与外部介质作用产生的正反激波中电子的同步加速辐射。伽马暴的多波段余辉数据可以很好地限制伽马暴的相关物理参数,比如喷流的结构、外部介质的密度等
作为我国能源保障的核心,矿产资源型城市给国民经济建设带来了强大的支撑。然而,随着资源开发的深入,资源枯竭与城市衰退问题开始显现。加之资源开采多年,产生了诸多问题,例如生态破坏、产业发展不均衡等。所以,为了保证矿产资源枯竭型城市可持续发展,精准地实施城市转型是十分必要的。矿产资源枯竭型城市如何转型,是全世界共同面对的困扰,需要政府在转型中起到权威性作用。政府部门如何全面履行职能,才能推动矿产资源枯竭
中共中央、国务院在2021年7月12日印发《关于新时代加强和改进思想政治工作的意见》,强调要“加强和改进社区思想政治工作”,为新时代社区思想政治工作的发展指明了方向、提出了要求。社区思想政治教育是社区思想政治工作的重要组成部分,也是基层思想政治教育的重要环节,创新社区思想政治教育对于强化社区治理,推进治理体系现代化有着重要的意义。本文以新时代社区思想政治教育为主要研究对象,通过对现有文献的阅读和整
根据GPS规范,对轮廓法粗糙度数据处理提出了切实可行的方案并通过编程实现算法:利用最小二乘拟合法消除测量数据中的标称形状;将高斯滤波器输出函数离散化,实现数字滤波器,并利用该滤波器滤除噪声,将原始轮廓、粗糙度轮廓和波纹度轮廓进行分离。
近年来随着城镇化水平的提升,大城市的规模与数量呈现高速发展的态势,进而引发城镇居民数量持续增多,城市拥挤现象加重等负面问题,且随着物质文明的满足,城镇居民在精神层面有了更高的追求,需求更加注重品质化、多元化。作为公共服务的重要载体,城市公园承载了城市居民对景观及绿色空间的期望,因此城市公园在建设中更加注重服务能力及管理能力的提升。本文以株洲市天鹅湖公园为研究对象,主要有以下研究内容:1.围绕“大数
海上风电凭借资源丰富、易消纳等优势成为未来风电发展的主流趋势,但受到技术薄弱、成本高昂的限制。其中,海上风电运维成本远高于陆上风电,合理分配运维资源、规划运维路线是降低海上风电开发成本、促进海上风电发展的有效措施。针对海上风电机组运维优化问题,论文的主要工作如下:建立了海上风电机组运维时间窗,由天气时间窗和策略时间窗构成。首先给出了基于马尔可夫链的海上天气时间窗计算方法。其次考虑风电机组运维紧迫性
目前,我国孤儿群体已获得了较好的社会救济,但由于缺乏原生家庭的照顾和指导,心理和行为上的问题较为突出,容易存在错误的自我认知和较低的自我控制能力。孤儿群体自我控制力低会直接影响其身心健康、个人性格的形成、人格品质的塑造、未来人生道路的发展。如何更精准地把脉孤儿群体的自控力提升问题,借助社会工作的专业理论体系,有针对性地帮助孤儿提升自控力,是一个重要的社工议题。本研究以“赋能计划”SOS儿童村社会工
区域经济发展的差异性是一种十分常见的现象,也是学术界研究的一个热点。那么,怎样才能缩小区域之间的差距,实现共同富裕呢?从经济增长的角度来看,要实现共同富裕,就必须使低收入群体的收入增速高于社会平均水平,即实现经济益贫式发展,这是达到共同富裕的一条重要途径。本文在区域经济差异和益贫式发展的相关文献和理论的基础上,基于州(市)域和县域两个尺度作为分析的空间单元,以云南省16个州(市)和129个县(市、