基于迁移学习的手术图像内容识别

来源 :山东大学 | 被引量 : 0次 | 上传用户:ti110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗技术的快速发展,人们对手术的需求也越来越大;手术种类与形式也越来越多、过程越来越复杂、手术的进行越来越依赖于计算机技术的辅助,手术的教育和培训也变得极具挑战性;手术过程本身亦需要证明其合理性。以上列举的事实都需要我们对手术流程有更加全面的理解与认识,为此研究人员提出了手术流程建模[2]。手术流程建模要求计算机根据人类的思维和感知来分析手术视频,其中如何跨越低级像素特征和高级语义特征之间的鸿沟是手术流程建模中最重要的一步,也是视频分析领域颇具挑战的一个研究课题。与传统的目标识别和视频分析不一样的是,手术视频有其独特的特点:手术视频是一场手术的完美再现,在手术过程中可能出现任何意外情况。而且,不同的手术需要用到不同类型的手术室和医疗器械,所以在手术视频中背景并不固定,手术器械和医护人员经常交叉在一起,对其自动化分析带来了极大的挑战性。目前的手术流程建模方法多是基于计算机视觉领域内已有的视频分析方法对视频进行整体分析,直接提取光流等适用于视频的特征,忽略了每一帧的底层特征与视频高级语义之间的鸿沟。为了解决这一问题,本文提出将卷积神经网络(CNN)应用于这一领域,分析手术视频中每一帧所包含的内容及其大致位置,桥接低级语义与高级语义之间的鸿沟。卷积神经网络是目前比较流行的图像分类算法之一,它通过有监督的方式学习图像的层次化特征表达方式。卷积神经网络训练的主要困难在于它需要大量的带标签的训练样本,现在虽然已经公开了许多优秀的手术视频,但是这些数据都没有被标注,无法用来训练卷积神经网络模型。而且由于专业知识的限制,一些手术视频和医疗数据只有专业的医护人员才有能力标注,所以在短时间内也无法收集一个大规模的数据集。我们收集了小规模的医疗设备数据集,其中主要是常出现于手术视频中医疗设备及医护人员的图像,并进行了标注,希望能对这一领域做出一些贡献。另外本文提出将机器学习中的迁移学习技术引入这一领域来解决缺乏带标签的训练样本的问题。实验结果表明,尽管面临手术图像带标签数据少、背景复杂、目标遮挡严重等挑战,利用卷积神经网络和迁移学习技术在手术视频内容识别上依然可以取得优异的结果。另外实验结果还表明了这种方法在目标定位以及活动识别任务上的巨大潜力,可以为手术流程建模的后续工作打下坚实的基础。
其他文献
本文主要利用光绪二十一年会试录、登科录材料,以及《明清历科进士题名碑录》等文献的相关记载,分析因为进士题名录的缺失导致康有为的进士身份受到质疑的问题,并且以康有为
MeanShift算法是一种无参数概率密度估计的算法。通过概率密度函数和有限次的迭代,能快速找到数据分布的模式。具有原理简单、参数少,无需预处理等诸多优点,被广泛应用于图像
本文通过对数字卫星广播电视信号的监测需求进行分析,对常见监测方法进行探讨,力求寻找合适的监测方法,为实际运行维护工作提供有效的技术保障手段。
本文通过对全国十九个主要仿形机床生产厂和上海地区十几个仿形机床用户的调查,纵观了我国仿形技术的历史和现状,进而提出了进一步发展我国仿形技术的意见。
合成孔径雷达差分干涉测量技术是新近发展起来的用于监测大范围地表形变的新技术,具有精度高、监测范围广等特点。文中深入分析DInSAR技术的基本原理,通过实验成功获取西安市
分析了三轮式齿轮连杆机构的运动特性,介绍了带停歇齿轮连杆机构的设计方法。结合VB对AutoCAD二次开发技术对机构进行运动分析、动态模拟。验证了设计结果的正确性,极大地提高
传统的罗拉车依靠人工控制,对工人的技术要求较高,对于复杂的加工,操作难度大,加工效率低,无法满足需求,为了提高效率、增加产量同时保障加工质量,结合自动化控制和数控技术
1 995年枯水、平水、丰水期对洞庭湖设 6个断面进行采样 ,共采到底栖动物 58种 ;其密度变幅为 78~ 544 .5个 /m2 ;1 0种常见种均成聚集分布。采用综合生物污染指数评价水体质