面向新冠和术后镇痛的可解释性特征筛选

来源 :华中科技大学 | 被引量 : 1次 | 上传用户:jujumao222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗数据分析的主要目的是找到疾病预测的相关因素,为医生诊断提供临床依据。现在,随着大数据技术不断发展和医疗信息化建设不断推进,越来越多的研究将机器学习应用到医学领域,从高维非线性特征中找到关键的少数特征,即医学上的相关因素。特征筛选作为处理高维数据的一种方法,能够将预测分析集中在重要特征上,帮助机器学习模型找到疾病预测的相关因素。医疗数据存在质量差、样本少、特征维度高等问题,导致现有机器学习和特征筛选方法难以找到具有临床意义的关键特征,而且分析结果在医学领域认可度不高。针对这些问题提出了基于投票式迭代学习的特征筛选,特征筛选过程以医学知识驱动的迭代式学习框架为基础。框架分为三个阶段。第一阶段是单特征多模型筛选,即通过SHAP(Shapley Additive ex Planation)分析工具衡量单个特征对不同模型的贡献来进行排序。然后结合医学知识,基于投票原则更新特征排序结果并筛选出靠前的特征。第二阶段是多特征单模型验证,即对初步筛选的特征子集进行分类预测,通过衡量分类模型的性能来验证特征子集的有效性。同时会根据医学临床知识对特征进行二次筛选。第一阶段和第二阶段的特征筛选和验证过程可反复迭代,以不断改善最终分类模型的性能。第三阶段是多视图验证,即从可解释、统计以及逻辑推理多个视图对筛选特征进行分析,验证其临床意义。医学知识驱动的投票式迭代学习框架已经在新冠重症早期预警和麻醉术后镇痛分析中得到了应用,经过特征筛选的分类模型性能与特征全集上模型性能十分相近。与其他特征选择方法相比,此框架训练得到的分类模型的AUC和平衡准确度BAC最高。在新冠重症早期预警中发现了6个与循证医学一致的关键特征,发现了3个新的早期预警相关因素。在麻醉术后镇痛分析中发现了4个与循证医学一致的关键特征和2个新的术后镇痛相关因素。
其他文献
船舶火灾事故中约有七成发生在船舶机舱中。机舱内部空间大、环境复杂,火灾一旦发生会迅速蔓延且极难扑救,严重影响船员生命及财产安全。因此,研究一套能在机舱内尽早精确地检测出烟雾、火焰的方法对于船舶安全有着重要意义。基于视频的火灾识别算法具有监控范围大,检测精度高,不受空间、距离环境限制,易于保存数据等优点,但现有火灾识别算法多在一些专有数据集验证,对船舶机舱实际场景适应性不够,直接应用到船舶机舱存在识
学位
是软件维护过程中的重要部分,为开发人员提供简洁易懂的解释说明。工业界软件开发项目中往往缺乏注释。代码摘要的自动生成技术可以减轻繁琐复杂的人工标注,释放更多优质劳动力。因此,研究代码摘要的自动生成技术对促进业界相关应用的发展具有重要意义和价值。领域仍然存在一些挑战:1.传统的序列到序列模型可以学习到源代码的序列表示,却难以学习代码的结构化语义信息;2.在传统代码摘要模型中,模型在训练过程中的目的是将
学位
由于电网络造价昂贵,维护困难等因素,传统的集中式发电技术逐渐难以满足区域分布式多元化发展的需求。微电网作为一种分布式供电技术,可高效整合包括太阳能、燃料电池等多种清洁能源,因地制宜应用灵活,具有广阔的发展前景。但是,受外部环境和天气因素影响,风、光等可再生能源及非弹性负荷的不确定性变化给微电网的能量调度优化带来了巨大挑战。为此,本文以光伏发电单元、固体氧化物燃料电池(Solid Oxide Fue
学位
党建引领既是推动乡村善治的前提,也是乡村治理显著优势的重要体现。党建引领具有保证乡村治理社会主义方向的政治优势,具有提升乡村治理体系和治理能力的功能性优势,具有保障乡村治理中人民主体地位的社会性优势。实践中,一些地方通过选派第一书记、强化党组织建设来引领乡村治理,显示出良好成效。党建引领乡村治理实践路径在于强化组织建设实现党建引领政治优势,构建党政复合治理体系实现党建引领功能优势,发挥党组织资源链
期刊
数字病理在信息管理、远程咨询、专家会诊、读片交流和实践教学等方面的应用,都依赖于清晰无损的玻片扫描图像。玻片扫描成像系统技术是数字病理创新发展的关键性技术,但是玻片扫描成像系统在将玻片数字化的过程中会因为离焦等问题,导致局部图像模糊,影响后续判读。因此,需要在病理玻片数字化之后,对全玻片扫描图像进行清晰度评价,找出其中模糊的局部图像块。由于主观评价方法费时费力;有参考评价方法因难以获得参考图像而受
学位
在物联网实现万物互联的同时,海量数据的涌入给核心数据网络造成了巨大的压力,而且随着智能监控、自动驾驶等低延迟应用场景的出现,将数据传输到远端云服务中心会造成极大的传输延迟,无法满足实时性的需求。边缘计算作为云计算的扩展,通过任务卸载将部分任务转移至边缘执行,减少流向云中心数据量的同时降低了数据的传输延迟。而边缘设备性能不一、资源有限,如何合理进行任务卸载调度是一个重要的研究方向。现有的边缘任务卸载
学位
近年来,图计算因其在解决实际问题中的广泛适用性而受到广泛关注。广度优先搜索算法是很多图分析算法,例如单一起点最短路径问题和中心度算法的基石。而在加速特定算法的运行速度,提高运行的能量效率方面,现场可编程逻辑门阵列(Fieldprogrammable Gate Array,FPGA)相比于CPU和GPU更有潜力。因此,在FPGA上加速广度优先搜索算法具有重要现实和学术意义。当前FPGA上的广度优先搜
学位
近年来,计算机应用技术蓬勃发展,但不同类型的计算机应用对内存的需求大不相同。当前主流的两种异构内存系统只能满足特定类型应用的内存需求。平行结构的DRAM-NVM异构内存架构可以充分利用NVM的容量,适合对延迟不敏感、对主存容量敏感的应用,如大数据相关应用;层次结构的DRAM-NVM异构内存架构可以缓存频繁访问的数据,适合对延迟敏感、对主存容量不敏感的应用,如互联网相关应用。基于RISC-Ⅴ的可重构
学位
大数据技术在近年来迅速发展,同时医学研究逐渐迈入信息化时代,两者的融合已经成为当下研究的热点。医疗领域的数据具有宝贵的研究价值,例如预测疾病的发生、分析患者的预后情况等。然而,医疗领域的数据往往是小样本数据集,存在数据量少的问题,无法训练传统的深度学习模型。因此,针对医疗大数据领域中的小样本问题进行研究,具有重大的意义以及现实价值。针对医学领域的小样本数据集,设计了基于医学经验的问题特征空间搜索方
学位
对C/C++源代码程序进行静态检测,由于缺少简单易用的威胁检测模型,静态分析工具的漏洞检测结果中存在大量的误报漏洞。目前判断这些漏洞是否为误报主要依赖人工繁杂分析,人工判断这些漏洞是否真的存在费事费力,且易出错。一个有效的解决方案是使用定向模糊测试找到触发该漏洞的输入,从而验证该漏洞是否存在。目前的定向模糊测试效率低下,需要优化定向模糊测试技术从而实现漏洞验证这个功能。在基于定向模糊测试的漏洞验证
学位