手术工具与手术流程识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:pconeone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代医疗技术的高歌猛进,计算机辅助外科手术己经迈入新的革命时代,正朝着智能化的方向转变。手术工具和手术流程的识别作为计算机辅助手术领域中的重要课题,对于加快手术智能化的发展具有重要意义。手术工具识别算法可以为医生提供准确、实时的手术工具运动轨迹以及位置、类别信息,增强外科医生的手眼协调,同时也能起到为医生提供风险预警的作用。手术流程识别算法能够在手术过程中为医生提供准确的手术进展报告,有助于医学实习生通过拍摄手术视频中进行技能评估。然而传统的手术工具和手术流程的识别算法大都存在精确度不够高、耗时、人工成本高、难以在实际场景中使用的缺点。对于这两项充满挑战的任务,本文提出了两个有效的方法用以实现高效、准确的手术工具和手术流程的识别,其主要工作如下:1.针对手术工具识别任务中多标签共存的特点,本文提出了一个基于Transformer架构改进的关系建模网络,对标签之间的关系以及标签与手术工具之间的关系进行相关性建模。此外,针对手术工具中的类别不平衡问题,本文设计了一种可以调节类别权重的损失函数,对整体网络进行监督,改善了工具类别之间样本数量高度不平衡的问题。本文提出的算法在大型公开数据集Cholec80上达到了93.85%的m AP值,优于该任务上的一些最先进方法。2.针对手术流程识别任务中类间样本相似的问题,本文提出了一种多任务、多尺度特征融合的策略,通过加入工具的标签信息来为手术流程识别任务进行信息补充,并在骨干网络之后增加一个由双向特征金字塔构成的特征增强模块,为网络深层的高级语义特征补充几何信息,使得网络能够提取出更具区分度的特征。此外,针对先前手术流程识别算法对过渡帧的识别精度低、训练时间长和内存成本高的缺点,本文提出一种双粒度时间卷积网络,从全局粒度和局部粒度两个方向进行时序建模,能够有效提取出手术流程中的时间上下文关系,在Cholec80数据集上达到了92.64%的Accuracy值,与其他最先进的方法相比,实现了更高效、更准确的流程预测。
其他文献
随着复合材料结构在航空、汽车等领域中的大量应用,复合材料与金属连接问题不可避免,异质材料连接逐渐成为工程应用的关键技术之一。相较于传统的机械连接,胶粘连接能够获得光滑的气动外形、降低结构重量,实现载荷在复合材料与金属材料之间的有效传递。然而在实际服役过程中,复合材料胶接结构在冰雹、碎石以及维修工具等冲击下容易产生被胶接件脱粘、层合板分层等内部损伤,从而严重影响胶接结构的力学性能。此外,对于航空航天
学位
民机客舱火灾人员逃生的研究受限于安全性、经济性、环保性等因素,利用计算机仿真软件可更安全便捷地模拟客舱发生火灾时的人员逃生过程,分析舱内火灾在不同时段内各因素对人员逃生过程的影响,从而提出可行性建议。首先分析了影响客舱火灾人员逃生的各类因素,主要为客舱环境、火灾产物、客舱人员三大类,为后续模型的建立奠定基础。接着使用火灾模拟软件Pyro Sim建立C919的客舱火灾模型,假设发生燃油泄漏火灾,设定
学位
命名实体识别(Named Entity Recognition,NER)是自然语言处理的任务(Natural Language Processing,NLP)之一,目的是检测出文本中的实体并且将其划分至预定义的类别中,可以实现自动化地从文本中挖掘有价值的信息,在不同自然语言处理下游任务中充当着非常重要的基础模块。基于深度学习的命名实体识别技术依赖于大量的人工标注数据,为了减少人工标注成本,可利用通
学位
静态航行情报资料的内容涵盖了空域、管制、航路、机场等空中航行所必需的信息,制作过程包含收集、审核原始资料数据、文字编辑和制图、多级校对等多个环节,每个环节中文字、数据处理的差错都可能会传递到下一环节,造成差错的传递和积累,而目前我国情报服务部门所制作的航行情报资料也确实一直存在着编辑差错、内容格式不规范、发布不及时等问题。因此,从静态航行情报资料制作过程出发,研究静态航行情报资料制作质量安全绩效,
学位
锂离子电池以其高能量密度、高环保、高循环寿命等优点,在各个领域广泛应用。然而,锂离子电池在长期的充放电循环过程中由于锂枝晶、机械滥用等客观诱因,可能会触发热失控而产生大量有毒或高度可燃性气体,导致后续剧烈的火灾或爆炸。因此,实时分析热失控气体对锂离子电池热失控早期预警、安全性评估和安全管理等具有重要意义。针对上述挑战,本文以气体拉曼光谱技术为核心,开发锂离子电池热失控全过程的气体原位在线检测方法,
学位
近年来,人工智能技术得到了飞速发展,在许多具有挑战性的任务中都取得了重大进展。这一系列进展背后的关键因素之一是海量数据的收集与利用。然而,在实际场景中,由于数据安全、隐私保护和法律约束等因素,数据的收集和使用通常面临极大限制,严重制约人工智能技术的应用。为解决上述问题,联邦学习应运而生,旨在通过构建协同训练机制,在不共享各客户端数据的条件下,训练高性能全局模型。作为一种新型的分布式机器学习范式,联
学位
热隐蔽信道(thermal covert channel,TCC)攻击将数据编码为温度变化,使用热传导传输隐私数据,危害性极大。由于TCC攻击不需要访问缓存、带宽等系统资源,具有极高的隐蔽性,对多/众核系统的芯片安全构成严重威胁,其危害程度与TCC传输能力相关,传输速率越高、误码率(bit error rate,BER)越低,短时间内TCC泄露的数据越多。研究TCC攻击对系统的信息安全具有重要意义
学位
近年来,由于我国民航业的飞速发展,乘机出行的旅客逐渐增多,也给机场旅客安检带来了压力。为实现民航安检“提质增效”的工作目标,已有部分机场开始对差异化策略旅客安检通道进行研究。为此,本文以差异化策略安检思想为基础,利用建模仿真方法对传统旅客安检通道、不同长度旅客安检通道、小件行李旅客安检通道和女性旅客安检通道进行研究。首先,本文利用AnyLogic仿真软件建立旅客agent模型,设计旅客的属性和行为
学位
智能行李安检X光违禁品检测系统对提高安检效率、维护公共安全有重要意义。近年来,卷积神经网络在目标检测及图像分类任务中的应用,激起了智能安检研究领域对于高质量、大规模数据集的需求。然而,现有的安检X光图像数据集在含违禁品的样本数量和多样性方面,都难以满足进一步提升智能违禁品识别及检测模型性能的需求。为建立一个含违禁品数量充足的安检X光图像数据集,本文给出一种基于改进循环生成网络(Cycle-Cons
学位
不同于求解两个平行支撑超平面的支持向量机模型,非平行支持向量机为每个类构造相应的优化问题,从而寻找一对互不平行的超平面。相关研究表明相比于传统支持向量机模型,非平行支持向量机具有更好的学习性能。在模式识别、数据挖掘和计算机视觉等领域,张量被广泛地应用于表示学习样本。然而,非平行支持向量机等向量分类模型往往不能直接将张量作为输入模式。一种常见的做法是将张量展开为高维向量,但这种做法不仅会破坏张量的内
学位