带有缺失数据乳腺癌BI-RADS的统计分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:dvrgbedr544y4d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学研究者能够通过生物成像技术从多个异构来源收集大量高维数据,继而用于医学研究。在乳腺癌的研究中,通常有多个来源的数据集,如乳腺超声数据集、乳腺钼靶数据集和乳腺MRI数据集等,联合两个或两个以上的数据源对乳腺癌的研究是有利的,通常医学研究者通过乳腺超声+乳腺MRI或乳腺钼靶+乳腺MRI来提高乳腺癌的预测能力。本文获取的数据是2017年3月-2020年12月昆明医科大学第二附属医院的乳腺患者超声数据和乳腺患者MRI数据,采用的是乳腺超声+乳腺MRI对乳腺肿块的性质进行分类预测,将乳腺超声数据与乳腺MRI数据整合到一个数据矩阵中,出现了块缺失条目,且数据类型为混合型(连续型/离散型),这里我们简称为块缺失混合数据。本文的块缺失结构为在291例样本中,261例样本有完整的超声数据特征,80例样本有完整的MRI数据特征,50例样本有超声数据特征和MRI数据特征,对于这样的块缺失结构,本文的目的是要填补其中的块缺失条目,使得291例样本拥有完整的数据结构,使得每一个样本有超声数据特征的同时也有MRI数据特征。本文对块缺失混合数据采用两种处理方法,第一种方法是miss Forest填补法,miss Forest填补法是利用随机森林方法的思想,拟合一个训练模型,对块缺失混合数据进行插补后使用随机森林对测试集进行分类预测;第二种方法是谱范数正则化模型的Soft Impute算法+机器学习分类;最后比较两种块缺失混合数据处理方法下的预测模型情况。基于miss Forest模型对测试集进行分类预测结果的评判指标显示:AUC值为0.8130,F1值为0.7658,准确率为0.8068,灵敏度为0.9394,特异度为0.7273;利用谱范数正则化模型的Soft Impute算法+随机森林模型对测试集进行分类预测结果的评判指标显示:AUC值为0.8700,F1值为0.8493,准确率为0.8750,灵敏度为0.8611,特异度为0.8848,该结果表明,当数据类型为块缺失混合数据时,基于谱范数正则化模型的Soft Impute算法+随机森林模型预测效果最好。
其他文献
清代著名温病学医家吴鞠通提出了“治中焦如衡”的理论,目前这一理论已成为治疗脾胃病的重要指导思想,对于指导临床实践具有重要的意义。《伤寒论》中的经典名方半夏泻心汤在治法上寒热同调、燥湿相济、升降相用、虚实相兼以宣畅气机,和调脾胃,巧妙地诠释了“治中焦如衡”的思想。基于“治中焦如衡”理论,梳理其理论渊源,并通过半夏泻心汤证的病因病机、治法治则、组方用药、临床应用进行探讨,以期为研究者提供参考,进而指导
期刊
金属矿山废弃地的环境治理一直是中国乃至世界共同面对的一个重要环境问题,尤其是如何对历史遗留下来的大量矿山废弃地研发出低成本、免(少)维护的综合解决方案,一直是相关领域的重要科技问题。从恢复生态学的角度来看,植物群落重建被认为是降低矿区土壤重金属污染、综合修复矿山环境的有效手段,但如何根据矿区废弃地植物群落的演替过程,顺应自然演替规律,找到人工积极促进更新的抓手以驱动和加速植物群落演替进程,目前还缺
学位
火作为生态系统中一种重要的生态因子,影响着植物个体的生存与植物群落的形成。在长期的进化中,发现许多木本植物已经形成相关的火适应性状。而根据植物功能性状研究群落构建有助于我们理解群落的形成。本文以云南松群落和地盘松灌丛为研究对象,通过可燃性三个主要参数:点燃时间、火焰持续时间及总释放热量进行比较。根据群落可燃性差异比较、主成分分析、功能性状聚类与功能性状结构探讨群落形成的过程,从而探讨火对群落构建的
学位
<正>在以国内外面向在线学习的情感计算核心文献为研究对象的基础上,本文使用CiteSpace软件对该领域文献关键词进行分析,绘制了面向在线学习的情感计算研究脉络图,通过深入分析核心内容的研究现状,发现目前研究存在的问题,并提出了构建开放丰富的学习者情感数据库、推动多模态融合的学习者情感识别研究、建立智能自然的情感交互机制等针对性策略,旨在丰富和完善在线学习中情感计算的研究路径与方法。
期刊
澜沧黄杉(Pseudotsuga forrestii)是第三纪孑遗植物,松柏目松科黄杉属的物种,属国家二级保护植物,其树形高大挺拔、四季常绿。澜沧黄杉为我国特有种,集中分布于我国云南省西北部和西藏东南部,沿着河谷两侧的陡坡分布。由于人为过度的砍伐利用,加之其生境的特殊,导致澜沧黄杉数量逐渐减少。为了阐释原生澜沧黄杉森林群落,从而对澜沧黄杉有更好的保护,本论文在澜沧黄杉群落分布的4个县,共设置49个
学位
全球气候变暖已成为人类面临的最严峻的环境问题之一。温室气体是全球变暖的主要促动因素,而氧化亚氮(N2O)作为三大温室气体之一,在百年尺度上的增温潜势是二氧化碳(CO2)的298倍。土壤氮(N)库占森林生态系统总氮储量的近90%,土壤是氧化亚氮(N2O)重要的排放源。而亚热带常绿阔叶森林土壤含有大量的碳氮储量,气候变暖可能会通过促进土壤有机氮矿化产生更多的无机氮从而进一步加速硝化作用和反硝化作用产生
学位
目前针对大空间建筑火灾空气升温的数值模拟基本都采用规则的矩形几何模型,然而在实际工程中,大空间建筑为满足使用功能和建筑造型等要求,几何形状经常采用曲面体或壳体。通过FDS程序模拟火灾场景,采用矩形单元拟合圆弧墙的算法,考察了圆弧形壁面对大空间建筑火灾下空气升温过程的影响;同时,基于MATLAB程序非线性拟合方法,建立了考虑圆弧形壁面影响的大空间建筑火灾空气升温经验公式。
期刊
浮萍,作为一种全球分布的水生漂浮植物,因能吸收水体中营养物质并生产富含淀粉和蛋白质的生物质,是实现水质净化及高品质生物质生产的理想植物。研究表明,浮萍附生有大量固氮菌并表现出较强的固氮能力,然而,截止目前,浮萍附生固氮菌组成以及附生固氮菌与浮萍的相互作用及其影响因素,尤其是氮浓度的影响几乎未见报道,有待进一步研究。因此,本研究以浮萍(Lemna japonica)及其附生固氮菌为对象,先在实验室的
学位
作为陆生生态系统中重要的干扰因子,火对植物演化的作用一直是火生态研究的重点。云南松(Pinus yunnanensis)是我国西南地区的特有种,有典型的火适应特征。本研究以分布在滇中地区的云南松为对象,从表型性状和基因转录组两个方面,研究云南松表型和遗传变异的分布格局及其与环境因子之间的关系。通过比较不同火险等级下云南松表型性状变异,探讨表型性状种内变化模式及其与火的关系;在基因水平对云南松群体进
学位
藏医药学是具有民族传统特色、理论体系完整、历史文化悠久,起源和形成于青藏高原的一门民族传统医学。该文在查阅藏医五味甘露药浴疗法及郎西(银屑病)的相关书籍、文献的基础上,概述郎西的病因及其发病机制、藏医五味甘露药浴疗法的发展起源及其历史背景,深入剖析藏医五味甘露药浴疗法独特的药物制备方法、作用机制与临床应用、禁忌证及其注意事项,简述藏医五味甘露药浴疗法治疗郎西的特点,以期为藏医五味甘露药浴疗法治疗郎
期刊