基于代价敏感学习的乳腺癌预测模型研究及应用

来源 :济南大学 | 被引量 : 2次 | 上传用户:sst3562008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是全球女性发病率居首位的恶性肿瘤,对女性健康、国民经济和社会发展都造成了极大的影响,已成为当前社会的重大公共卫生问题。乳腺癌发病隐匿,确切病因尚未完全明确,一般认为与遗传、生育、行为生活习惯等多种内在和外界的因素共同作用有关。早期乳腺癌通过规范化治疗,治愈率较高;中晚期乳腺癌虽可延长患者生存期,却难以彻底治愈。由于人们早发现、早诊断、早治疗的健康意识淡薄,加之我国人口众多、医疗卫生资源有限等因素,很难实现全国范围内的乳腺癌筛查工作。因此开展乳腺癌预测模型的研究,及时筛选出乳腺癌高危人群,从而有的放矢显得尤为重要。课题引入代价敏感学习算法,对乳腺癌预测模型进行研究,进而实现对高危人群的筛选,达到乳腺癌辅助检测的目的。本文的主要工作内容如下:(1)数据分析。课题收集并整理1031位就诊者的临床诊疗数据。分别对训练数据(数据集1)中定量因素之间的独立性,以及各因素在病例组和对照组之间的差异性进行分析。将具有统计学意义的影响因素变量纳入乳腺癌危险因素中,并组建新的实验数据集(数据集2)。(2)提出了一种基于阈值优化Logistic回归的乳腺癌预测模型。针对实验数据存在的不平衡问题,实验采用优化分类阈值的方法提升Logistic回归模型的预测性能。本文分别对数据集1和数据集2构建Logistic回归模型,并且通过查准率-查全率曲线评价改变阈值对模型性能的影响效果。实验表明,数据集2构建的Logistic回归模型设置阈值为0.031时,模型Main_Logistic_Model预测性能最高,其AUC值为75.08%,敏感度为71.43%。(3)提出了一种基于代价敏感决策树C5.0的乳腺癌预测模型。在不平衡问题中,不同的分类错误会导致不同的分类代价。实验通过引入代价矩阵(cost matrix)的方法,分别对数据集1以及数据集2构建的决策树C5.0预测模型进行优化。实验表明,数据集1构建的决策树C5.0模型,设置c(A)/c(B)比值为18/1时,模型C5.0_Model的预测性能最优,其AUC值为89.37%,模型的敏感度更是高达100.00%。(4)设计并实现了乳腺癌预测系统。针对本文提出的两种不同的分类器,制定合理的系统算法,设计并实现乳腺癌预测系统。其包括用户端和管理员端。用户端通过收集用户相关指标,实现对女性乳腺癌的患病风险进行预测,及时有效的筛选出高危人群,对于乳腺癌的辅助检测,具有积极意义。
其他文献
激光线结构光扫描仪得到的三维点云数据具有冗余性,本文设计实现了一种基于两阶非均匀划分的点云精简算法对机车走行部数据进行处理。首先,根据内在形状特征算法估计出检测对
癌症作为世界范围内一个迅速发展的健康问题,对人类的危害和经济威胁日益增加。在精准医学中,准确的风险评估是实施风险筛查和预防性治疗的先决条件,而癌症发生风险预测模型的研究开发有助于癌症的早期发现和治疗。目前大量研究针对癌症发生风险构建了相关生物信息学预测模型,但是缺少有效的资源整合。因此,癌症发生风险预测模型知识库的建立与分析具有重要意义。本课题的研究主要从三个方面展开:第一部分,我们借助PubMe
日本无产阶级文学是日本文学史一个不可分割的组成部分,也是20世纪30年代日本革命运动的重要一环。在整个日本文学史中,没有哪个流派像无产阶级文学这样重视文学理论的建设。
近年来,随着电子科技、新能源技术的快速发展,锂电池产品得到了广泛使用,其产量日益剧增。大量锂电池产品的使用必然伴随着废旧锂电池的巨量报废。废旧的电池中既含有许多金
目的:探讨益母草注射液联合缩宫素在剖宫产术中及术后出血中的应用效果。方法:将行剖宫产手术的产妇100例随机分为观察组50例行益母草注射液联合缩宫素治疗;对照组50例行缩宫素
由于有源电力滤波器受到系统阻抗变化、运行方式以及负荷变化影响小,可灵活补偿系统谐波电流与无功电流,在谐波治理、提高电能质量等方面具有重要意义,因此对其开展研究具有十分重要的意义。本文以带LC输出滤波器的三相二极管中点钳位(Neutral Point Clamped,NPC)三电平拓扑的有源滤波器为研究对象,开展基于变采样频率可调制滑窗迭代傅里叶谐波提取算法的并联有源滤波器(Active Power
书籍被人类划分为两种形式:电子书籍与传统纸质书籍,前者是信息时代下的产物,后者是传统文化的精华。中国传统书籍艺术有自己的变化形式,遵循“甲骨文-简策-卷轴-册页-明清线装-平装胶装书籍装帧”演变形式。鲁迅是现代书籍装帧艺术的开拓者,他汲取从古至今的书籍装帧设计思想,兼收并蓄,最终却因战乱戛然而止。及至20世纪80年代重现繁荣景象,吕敬人吸收前人书籍设计的先进理念,创建了当代中国书籍设计体系。吕敬人
在我国农业现代化发展过程中,农业信息化扮演着重要的推动作用。近年来,农业相关信息资源呈现爆炸性增长,导致严重的“信息过载”问题,使相关农业用户无法及时、准确且有效获
目的:磁共振扩散加权成像(diffusion-weighted imaging,DWI)是当前能够无创性地评估活体组织内水分子扩散运动的成像技术,在临床中主要分为单指数模型(single index model,SIM)、双指数模型(double index model,DIM)两种,能够从肿瘤组织的内部反映其细胞的微观结构和功能状态,从分子水平提供肿瘤分化程度方面的重要信息。单指数模型只行单一的
毫米波频段因其宽带、高速、干扰小等优势在车载通信和蜂窝移动通信方面得到了日益广泛的关注,而获得应用场景的无线信道特性则是设计和优化无线通信系统的前提,但目前学术界