基于Spark和随机森林的乳腺癌风险预测分析

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:tx_programming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代医疗正在朝着智能健康的方向发展,在此大背景下,为了提高乳腺癌风险的发现及预测效果,本文采用大数据分析技术并基于随机森林模型,应用多个弱分类器,将多个决策树获得的结果进行集成,得到疾病发病概率;并采用管道学习方法来训练模型,基于该模型开展了致病因素分析以及结果预测。同时,通过皮尔逊相关系数和Spearman等级相关系数来进行相关度分析,研究权重较高的影响因子,提高乳腺癌风险的监测和早期预防。实验表明:在乳腺癌致病细胞细胞核的相关参数中,Perimeter、Texture和Concave points影响因子对于乳腺癌的致病影响程度较大,更易导致疾病的发生。本文基于管道训练方法所建立的模型预测精度可达99.04%,精度高、方法可靠,有一定的实际应用价值。最终的实验研究结果对于乳腺癌风险的发现具有一定程度的参考意义。
其他文献
行进间投篮技术是现代篮球比赛中运用较为普遍的进攻技术,具有很强的攻击性和破坏性,本文结合生物力学知识,对行进间投篮技术运用的不同类型及其动作方法进行分析,以期能增加
随着城市化、工业化的快速发展,全球气候变暖,人们逐渐认识到研究城市热岛效应的重要性。现以西安市为研究对象,以2000年的Landsat7 ETM+数据和2016年Landsat8 OLI/TIRS数据为
最近,山东省第十一届人大常委会第三十次会议决定,将立法保障企业权益服务实体经济的发展。此次提交审议的《山东省企业权益保护条例(草案)》(下称《草案》),重点对国家没有
农业专用自动导引小车(AGV)作为农业作业的通用运载平台,是针对具体应用环境而设计的特定用途机器人,已成为农业自动化的一个重要发展方向。为此,介绍了一种基于多轴运动控制
<正>目的探讨肺间质纤维化合并肺气肿综合征(Combined pulmonary fibrosis and emphysema,CPFE)的临床特点,并与COPD及IPF进行比较,以提高对此病的认识。方法回顾性临床病例
会议
2007年底,一个叫“数字星球系统”(多媒体球幕投影演示仪)的、能广泛应用于小学科学和地理学科等多领域教学的数字化教学仪器出现在基础教育领域。从那时起,这个能动态、立体地再
双主体育人模式适应高职教育的发展趋势,为学生职业素养培养提供了新思路。文章基于高职教育的特点和校企合作育人的优势,提出“阶段培养、层级递进、协同育人”的建设思路,
国家公园具有极其重要的科学和研究价值,在保护基础上进行科研与监测,也是国家公园的主要功能之一。为充分发挥国家公园重要的科研平台作用,支撑和提升国家公园建设管理,在科
社会的发展,网络技术的不断成熟,在使电视新闻传播受到网络新闻传播冲击的同时,也带来了新机遇,不断推动电视新闻传播理念与节目形式的创新,本文针对电视新闻传播受众意识来探讨电
《道德经》的理论基础由“道”和“德”构成。“道”是人生观、世界观、政治观等上升到本体论的高度概括,是形而上的;“德”则是“道”的具体展开,是“道”在人生中的具体指