基于多元logistic回归与决策树对乳腺癌组织学分级的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:bengkuia521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌作为威胁女性健康的常见恶性肿瘤之一,较多的出现在欧美等国家。近几十年来,作为不是乳腺癌高发地区的亚洲,却出现女性乳腺癌发病率逐节攀升的情况,虽然目前中国乳腺癌发病率低,但是发病率的增长速度是全球的两倍,而在我国的沿海地区以及一线城市,女性乳腺癌的发病率更是呈现令人担忧的状况,而年龄处于50岁左右的女性,其恶性乳腺癌的发病率尤为明显。为了研究是哪些因素主要影响着描述乳腺癌恶性程度的组织学分级(癌细胞分化程度),本文从美国癌症数据库中挑选了所有关于乳腺癌的影响因素。由于患者数据量以及原始选取的变量众多,首先需要对数据进行大量的清洗预处理,包括多次使用多元logistic回归分析中变量的显著性来确定变量的选择,删除P值远大于0.05的变量,对有争议的的变量通过再次多元logistic回归分析中的显著性和准确率分析来确定是否保留。最终通过留下的变量,即研究患者病理上的影响因素包括雌激素受体(ER)、肿瘤大小、年龄、人表皮生长因子受体2、检查的区域淋巴结数目、孕激素受体(PR)、肿瘤位置以及县属性的社会影响因素包括标准化生活费用指数、贫困人口比率、9年以下受教育率、高中以下受教育率、婚姻状况、正在抽烟比率、贫困家庭比率,来对2011年2015年五年间处于45岁至74岁之间的患有乳腺癌恶性肿瘤女性患者的严重程度展开分析。而后将数据分为训练集与测试集,构建多种决策树来拟合预测,最终确定使用决策树的C5.0算法和CRT算法,并获得0.8181和0.7983的准确率,在ROC曲线下的面积为0.818,效果良好,在灵敏度上获得了0.9的高分,模型对癌细胞分化较好的患者案例预测很好。通过分析得到的变量对组织学分级的影响结果,对未患病的女性有如下建议:1.定期检查,2.提升自我素质、不抽烟、学会释放经济上的压力。
其他文献
本文提出了一种新型结构的两自由度永磁电机,并从电机结构、动力学模型、仿真分析和试验等方面进行了研究。首先,提出了一种两自由度永磁电机新模型。电机结构上采用了双万向
合肥晚近办公建筑作为合肥晚近历史建筑中数量最多的类型之一,不仅承载了合肥晚近建筑的发展线索,并且反映出城市的整体面貌,影响着晚近建筑的风格与审美。因此对其进行研究
本文以柔性多孔的纤维素纤维(CFs)为基材,高电容性的过渡金属钼酸盐(MMoO4)、磷酸钴铵(NH4CoPO4)和高导电性的聚吡咯(PPy)为电活性材料,采用两步原位法分别制备了 PPy@MMoO4/
新课程改革后,学生从高中阶段就开始接触并学习微积分知识。导数作为微积分的核心概念,不仅在高中数学课程中起着重要的作用,而且影响学生在大学阶段高等数学的学习,起着承上启下的作用。因此,调查高三学生对导数概念的理解水平,探寻学生在学习过程中存在的问题便具有一定的现实意义。本文首先运用文献分析法,对国内外导数概念的相关研究进行了梳理和分析,并借鉴已有研究,依据《普通高中数学课程标椎(2017年版)》对导
钢板剪力墙是一种新型高效抗侧力构件,与钢筋混凝土剪力墙相比,其具有延性好、结构刚度大、抗震性能优良等优点,同时还可以有效的减小墙体厚度、减轻结构自重进而增加建筑的使用空间。两边连接钢板剪力墙通过焊缝或高强螺栓仅与框架梁连接,与四边连接钢板剪力墙相比,避免了框架柱过早发生破坏;跨高比较大的两边连接钢板剪力墙布置灵活,可以在一跨中分段布置,便于开设门窗和过道。通过调整墙板尺寸或数量,方便地改变剪力墙的
目前,在我国东北等高纬度高寒深季节冻土区,强风化围岩老旧隧道由于季节冻土区春季融化,冬季冻结的特点,隧道衬砌频繁出现渗漏、挂冰以及开裂等灾害。严重影响到了列车运营安
本文所采用和瑛诗歌全部来自《易简斋诗抄》与《太庵诗草》。经统计、校对后,得古体诗81首,近体诗690首。将韵脚字逐字填写音韵地位后,运用数理统计法,将和瑛古体诗定为18韵部,近体诗定为16韵部。研究目的在于探查和瑛作为蒙古族诗人对于汉语音韵的掌握程度并借此阐明乾嘉之际的语音面貌。和瑛古近体诗用韵既有贯通性,亦有差异性。在近体诗阴声韵中,灰咍合韵,灰韵却又不可避免地与支微部产生通押;近体诗中肴韵、豪
针对一类在随机振动工作环境中的直流电机驱动的桥式起重机,研究了随机建模与轨迹跟踪控制问题.首先根据拉格朗日力学和电磁学建立确定性模型.然后根据动静法和等效电路,将环
科技的快速发展,数字图像增强技术得到广泛应用。直方图均衡化是图像对比度增强的主要方法之一,用于提升图像对比度,达到提高图像视觉质量与机器识别图像关键特征的目的。直方图均衡化又分为全局直方图均衡化算法(GHE)和局部直方图均衡化算法(LHE)。全局直方图均衡算法通过自动拉伸图像动态范围获得较高对比度。GHE算法容易导致高频直方图部分的过度增强以及合并低频灰度级引起的细节丢失,并且其输出图像亮度不能有
目的:股骨近端防旋髓内钉(PFNA)作为老年股骨转子间骨折常用的内固定器械适用于各种类型的股骨转子间骨折。2018版AO分型充分考虑了股骨转子间骨折时外侧壁的完整情况,将累及