基于单目的胃肠图像深度估计方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:why_2213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胃肠病是人们在生活中常见的疾病。目前,一种常见的胃肠病的诊断和治疗方式为导入胃窥镜来观察。深度估计是为内窥镜导航系统提供距离信息的重要手段。然而,组织多样性和血管纹理等干扰给深度估计的精度带来了很大挑战。为了更好地提供距离信息,本文从两个方面研究深度估计方法——监督学习和自监督学习。首先,本文使用的监督学习方法要求图像的深度图参与训练,利用卷积神经网络来实现深度估计。使用了两种监督训练方式,一种方式是使用单目胃肠图像实现监督学习,利用ber Hu损失函数作为监督对象。第二种方式是使用双目胃肠图像实现监督学习,提出左右视角一致性损失函数。虽然使用双目胃肠图像参与训练,但是在测试阶段和实际应用时仍然利用单目图像。左右视角一致性损失函数的原理是将双目深度图转换到同一坐标系下,最小化两者之间的差异。以上两种监督方式均使用多尺度损失计算,并且设计了一种新的解码结构。除此之外,本文把注意力机制引入深度估计任务中,以提高深度估计的精度。具体地,重新设计了通道注意力机制和空间注意力机制,并且将它们合理的嵌入到卷积神经网络中。其次,针对深度图标签不足或者无法提供的情况,本文利用了自监督学习的深度估计方法。具体地,利用双目视觉的重建来构造损失函数,从一个视角的图像重构出另一个视角的图像,从而获得用于监督的深度信息。此部分的预测对象从深度图转换为视差图。在实际应用时,视差图可以利用相机标定参数转换为深度图。自监督学习使用的卷积神经网络结构与监督学习使用的卷积神经网络结构相同,并且也加入了注意力机制提高预测精度。在模型测试阶段,本文使用同分布测试集和异分布测试集来探究模型的性能。同分布测试集的测试结果中,平均绝对误差最优达到6.49毫米,明显优于异分布测试集。利用自监督学习测试视差误差,同分布测试集结果优于异分布测试集结果。在监督学习和自监督学习中,注意力机制对模型的性能都有提高作用。
其他文献
由于就地化保护装置本身采用高精度防护设计直接安装于开关场,为能够适应复杂的气候,与普通装置相比,省略了液晶显示屏和操作键盘,仅保留“运行”、“异常”、“动作”三个指
本文借助生态位、土地势能和地理势能相关理论,尝试提出土地位理论并基于这一理论构建土地位指标体系,结合湖南省2009-2014年的相关指标数据,采用全排列多边形图示指标法计算
约瑟夫·阿伽西认为,科学合理性的关键问题是划界问题,而划界问题的任务不在于对科学进行严格的概念限定,而在于规范科学态度。他将“批判”这种科学态度设定为划界的元标准,从而试图将科学理论与实践结合起来,以期正视科学社会价值的同时保持理性的相对独立。为此,他一方面对批判进行澄清,并以其作为判断形而上学合理性的标准;另一方面将科学自治与划界问题联系起来,力图实现科学政治民主化。本文分为以下四部分:第一,全
配对交易是一种特殊的统计套利策略,它通过形成期选取股票对、交易期跟踪基于价差序列的开仓信号,从而构建股票对的多空组合,进而赚取价差收敛的收益。配对交易具有风险中性
近年来,环境治理已经成为热门议题,各地政府也在积极推行绿色发展机制,希望能早日解决经济发展和环境保护之间的平衡问题。一方面,中央政府作为我国最高层级的管理部门具有控
为了改变过于注重知识传授、忽略学生情感态度价值观培养的局面,增强物理教学实施的可行性,新课程改革在《普通高中物理课程标准(2017年版)》中正式将物理教学目标从“三维课
为了研究有限的自然资源和控制措施对蚊子种群以及登革热病毒传播的影响,本文建立了一个考虑蚊子种群阶段结构的登革热传播动力学模型.本文首先对模型进行了一些理论分析,证
资产配置一直以来都是学术界和投资者关注的焦点,马克维茨奠定了现代金融理论关于资产配置的研究基础,定义了资产组合的收益率与风险,并且将数量化分析引入到资产组合管理当
当下,通信网络在规模、结构、网络业务种类和数量等多个方面都已变得十分庞大和复杂,这使得传统的着眼于局部的网络管理方法面临着工作量和工作难度急剧增长的巨大挑战。这些
本课题所研究的颞下颌关节虽然非常小,但是复杂程度非常高,影响着人们日常的张口运动,如咀嚼、说话等功能均与颞下颌关节紧密相关,颞下颌关节异常引起的相关口腔功能障碍也会