基于分类监督学习算法的乳腺癌预测诊断研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:yaojunsyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌具有较高的发病率和死亡率,严重威胁女性的身体健康。因其发病机理难以确定且病情隐匿,所以早期乳腺癌很难被发现,不易引起患者的重视。大量乳腺癌患者由于错过最佳治疗时机而导致病情加速恶化,甚至威胁生命。人工筛查肿瘤过程存在效率低以及主观性强的缺点,使得乳腺癌患者无法得到根治。近年来我国各个领域的数据量成指数规模扩大,而与日俱增的医疗数据也给医务工作人员带来压力和挑战。医疗数据与一般数据相比有着异构性、冗余性、隐私性等特点。医务人员需要投入大量的人力物力才能从类别差异极大的数据中获取有效信息进而诊断疾病。由于传统医疗诊断方法有一定的局限和不足,本文从分类监督学习算法入手,挖掘乳腺癌患者的相关数据并利用模型进行预测。本文的主要工作如下:(1)阐述了传统的乳腺癌诊断治疗方法,针对仅依靠临床经验和影像学诊断的缺陷,选择开放的UCI数据库作为数据来源,将决策树算法应用到乳腺癌临床医疗预测中,利用患者乳房硬块的细针抽吸数字影像数据进行肿瘤良恶性的预测。结合因子分析法从较多属性中选出影响较大的因子作为当前节点的测试属性,并自上而下递归建立模型,在此基础上对决策树进行最佳深度的探索,构建最佳决策树模型。实验结果表明,决策树算法对于乳腺癌肿瘤良恶性有较好的预测效果,但模型并不稳定,且在训练集上的准确性还有待提高。(2)决策树模型易于解释和理解的特性十分适合于复杂专业的医疗数据集挖掘,但很难探索到全局最优决策树。为了进一步提高预测的准确率,提出了k近邻改进算法W-k NN算法。该算法首先对样本属性进行标准化处理,并对不同距离进行加权,最后调整k的取值。实验证明,W-k NN算法可以更好的预测乳腺癌肿瘤性质以及癌症复发情况。(3)建立了乳腺癌肿瘤辅助预测系统,不仅可以提升数据挖掘的效率和质量,还可以为医疗单位工作的开展提供有效的支持,同时将乳腺癌的治疗决策聚焦于个体化,提供精准医疗服务。
其他文献
随着狭义相对论的提出,人们对时间与空间有了更深的理解,之后随着广义相对论的提出,又使得人们对于引力有了更深层次的理解。另一方面,对爱因斯坦引力场方程求解得到的黑洞解
现代工程建设项目日趋复杂,其现场施工过程和建设规模在不断扩大,使得项目现场施工进度控制管理和资源优化配置显得更加重要。凭借经验开展施工管理和决策不可避免地会导致决
改革开放后,我国的城市化进程发展迅速。快速的城市化进程往往注重硬指标,要想满足社会日益增长的文化需求,增强城市竞争力,实现全面小康的目标,必须加强城市文化建设。档案资源作为城市文化发展的记录者,其文化功能正日益突显,因此,将档案信息服务融入城市文化建设是大势所趋,必要之事。各城市在档案工作中应积极促进档案信息服务融入城市文化建设,使两者协同发展。本文理论联系实际,通过探析石家庄市档案工作中档案信息
在计算机视觉领域中,行为识别方向是其中一个非常重要的研究分支,随着计算机软硬件性能的不断提升,使得现在卷积神经网络的深度和复杂度与之前的网络相比有了大幅度的提升。
勃起功能障碍(erectile dysfunction,ED),又称阳痿,是一种典型的男性性功能障碍疾病,主要以阴茎勃起的启动和维持困难为主要表现,国外有研究表明,52%的40-70岁男性存在不同程度的ED,年发病率为25.9/1000。我国研究也显示40岁以上男性勃起功能障碍患病率达40.2%,并且近年来呈高发及低龄化趋势,这可能与人们逐渐重视生活质量的意识水平提高有关,但同时,随着近年来生活水
全身性动脉硬化会导致血液循环停滞,甚至引发梗死。视网膜动脉硬化是全身性动脉硬化的典型表现,且视网膜血管是唯一可进行无创观察的血管,因此可通过定期视网膜动脉硬化检测
在混合现实远程临床治疗或手术过程中,远程指导端在病患器官三维重建的虚拟模型上对手术部位进行标注完成对本地端的手术指导。本地端医生通过头戴式透镜将重建的器官模型和
近年来,随着国内多地频繁出现“城市看海”以及洪涝灾害现象,给城市系统造成巨大压力和破坏的同时,也给城市居民带来一定的经济损失并威胁生命安全。为有效应对城市内涝的态
相比于传统的电子式传感器而言,光纤传感器具有精度高、体积小、耐腐蚀以及抗电磁和辐射干扰等诸多优点。在光纤传感技术的基础上所发展起来的光纤表面等离子体共振(Surface
建设智慧钢铁工厂是钢铁企业响应“中国制造2025”的重要方向,热轧作为钢铁生产全流程炼钢-连铸-热轧中最后一道工序,其产线设备的健康状态是影响企业可持续生产的重要因素,