基于多示例学习的弱监督目标检测在医学超声图像的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:wanglt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的计算机辅助医学图像检测技术,可提高医生诊断的准确率以及效率。由于医师资源有限,且图像标注代价较高,所以弱监督目标检测受到了较大关注。其中,多示例检测网络为弱监督目标检测技术的主流方法,但其存在局部最优问题。论文认为导致此问题的原因包括:第一,多示例检测网络通过在线实例分类器细化阶段的K个分支逐步更新候选框信息,但此过程中存在监督信息丢失情况,进而导致候选框的偏差。第二,多示例检测网络仅将最后分支的预测框作为最终检测结果,缺乏全局把握,导致预测目标的不完整。此外,医学超声图像在不同类别的目标之间、目标和背景以及其他器官结构之间差异较小,较难区分目标的类别和位置。因此论文旨在研究适用于医学超声图像的弱监督目标检测方法,主要内容包括:(1)针对候选框偏差问题,论文提出密集细化方式,在远距离分支间添加监督信息传递过程,使当前分支受到前序各分支的直接监督,进而减轻候选框信息的偏差。(2)针对预测目标不完整问题,论文提出感知推理方法,通过动态拟合K个分支逐步优化的过程,推理出最终的检测结果,加强检测结果的全局性。(3)针对医学超声图像的特点,论文加入高阶注意力机制,捕捉图像内的细节信息,扩大像素间差异,从而提高对目标类别和位置预测的准确性。论文在甲状腺超声图像上应用所提出的方法,设计并实现消融和对比实验,评价指标m AP和Cor Loc分别达到62.23%以及68.45%,证明提出的方法优于目前现有的方法,对医学超声图像检测的辅助诊断具有参考价值。
其他文献
线索语是一种针对聋人或听力受损者的交流系统,说话人通过手的形状(编码辅音)和位置(编码元音)辅助唇读,以在音素级别对唇部视位进行互补表示。嘴唇、手形和手的位置特征的提取是线索语自动识别的关键步骤,其中手形特征的提取是该领域的难点之一。在线索语识别中,线索语的手唇运动异步问题往往导致基于音频分割的手形标注出现大量噪声。因此,论文首先提出一种基于自监督对比学习的方法学习手形的特征表示,以降低模型对数据
学位
随着经济社会的发展,人们对石油及其产品的需要持续上升,油轮交通、近海钻探、石油运输导致的海上溢油事件愈发频繁,而油类污染物的泄露会对海洋环境造成重大污染,对人类健康造成严重危害,因此,预测油类污染物的传播过程,减小污染物的影响程度变得迫在眉睫,而这依赖于对流扩散反应问题的准确求解。本文首先对溢油问题的数学模型进行了整理,通过Navier-Stokes方程组中的连续性方程和动量方程推导出浅水波方程和
学位
线索语是一种面向听障人士的视觉交流系统,用手部运动补充唇读信息以获得完整的音素表达。其相较于唇语和手语,在保证更完整的视觉信息表达,消除具有相似唇形的音素歧义同时,更加简单明确,适用于人机交互领域。但由于线索语数据不足导致其相关研究的识别效果受限。论文提出基于跨模态知识蒸馏的线索语自动识别的方法以克服数据不足的问题。该方法以教师-学生结构为载体,将从教师模型中提取的语音模态信息转移到学生模型的线索
学位
网络时代的到来,使得信息过载问题日益凸显。会话推荐系统是解决信息过载问题的重要工具。深度学习方法最近被用来建模会话数据,挖掘会话中的序列信息。虽然现有工作取得了良好的效果,但这些工作大多只将用户交互过的项目作为输入信息进行分析,忽略了用户活动发生的时间所反映出的用户兴趣。本文使用时间感知算法来解决会话推荐问题。时间向量生成器首先对用户活动的时间戳进行处理,得到用户在每个项目上的驻留时间和每次活动与
学位
水力发电因其具有清洁、无污染、廉价、可再生等特点,在国家的社会经济发展中有着极其重要的作用。对入库径流变化的精准预测往往是制定发电计划、进行电网调控调度的基础。由于水电站的入库径流受到上下游出入库径流及气象条件等多重因素的影响,当前基于随机过程的单步及多步自回归预测模型在预测精度方面都难以达到预期目标。本文将入库径流预测看作是一个监督回归问题,充分利用上下游出入库径流序列及气象条件信息,构建了单步
学位
深度神经网络(Deep neural network,简称DNN)因其性能出众,已被广泛应用于各大领域,因此保证DNN的质量是至关重要的。但是,为了得到DNN模型的准确率,需要人工标注大量的测试输入,成本巨大,甚至某些测试输入需要多人标注或者具有专业领域知识的人进行标注。这使得DNN测试存在严重的效率问题。为了缓解这个问题,本文提出了PACE(Practical ACcuracy Estimati
学位
500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,FAST)是目前世界上最大的单口径射电望远镜,空前的观测能力对数据处理性能提出了新挑战。河外中性氢(HI)谱线观测是FAST重要科学任务之一,Gridding是其观测数据处理流程中计算最密集的步骤,目的是将间隔不均匀的原始数据重新采样,输出到均匀划分的网格中,从而
学位
目的:分析分析下肢深静脉血栓形成患者应用机械碎栓联合导管接触性溶栓治疗后效果。方法:选取我院2018-06~2020-11收治的84例下肢深静脉血栓形成患者根据抽签法分为两组。对照组42例给予导管接触性溶栓,观察组42例联合机械碎栓,对比两组疗效、血栓弹力图及细胞黏附分子。结果:观察组临床效果、血清Pecam-1、血清Vcam-1、D-D、Fib、FDP较对照组低(P<0.05)。结论:机械碎栓联
期刊
随着知识图谱的不断发展,RDF图数据规模也急剧扩大,越来越多的RDF数据的应用对RDF图数据的质量提出了更高的要求,基于RDF图数据的应用和数据库也产生了对图数据质量进行验证的要求,它们希望RDF图数据具有一定的正确性和完整性。同时RDF图数据的质量保证有利于RDF图数据的管理。知识图谱验证问题成为图数据管理中被较少研究但十分重要的问题。对现有的图数据验证方案进行了详细的调研,总结了现有的研究方向
学位
党的十八大以来,文化遗产保护工作得到高度重视,我国古建筑遗产是文化遗产的重要组成部分。斗栱作为古建筑中的重要节点,具有耗能减震、伸挑出檐等功能。对斗栱内部关键组件进行分析,有助于更加深入地了解斗栱本身的传力机理和结构特点,目前相关研究较少。基于以上背景,本文选取了斗栱中的关键组件——下昂作为研究对象。下昂在斗栱中具有重要的悬挑功能,是斗栱中的典型构件。本文采用力学试验、数值模拟、理论公式推导的方法
学位