基于卷积神经网络的甲状旁腺识别研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:vvf022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着医学信息的飞速发展,各种医学影像数据也越来越丰富,医学图像目标检测不断发展完善。针对腔镜甲状腺切除手术这一场景,甲状旁腺损伤可导致甲状腺患者术后终身的低钙血症,医生在腔镜手术时需要保障其不受到损伤。然而,甲状旁腺是很小的腺体,且在腔镜甲状腺切除手术中可能会出现充血和阻塞,这使得经验丰富的外科医生也很难识别它们。因此,通过计算机视觉中基于卷积神经网络的目标检测技术识别并定位甲状旁腺的位置,可以辅助外科医生在不损伤甲状旁腺的条件下顺利完成腔镜甲状腺切除手术,具有十分重要的现实意义。本文以腔镜甲状腺切除手术影像作为数据集,通过基于卷积神经网络的目标检测算法识别并定位甲状旁腺的位置,以便外科医生在手术过程中可以保护甲状旁腺不受损伤。本文的研究内容即为从实际应用效果上识别并定位甲状旁腺的算法及系统实现,具体内容如下:1、对合作医院提供的甲状旁腺视频数据进行处理。首先,本文提出一种基于帧间差分的算法对视频进行关键帧的有效提取,形成甲状旁腺图片数据集;然后,对数据集中的图片进行标注、整理,形成可以满足模型输入的标准格式;最后,由于腔镜甲状腺切除手术过程中采集的图片数据具有信号不稳定,颜色区分度低等特点,同时还会受到雾气、视角、距离、遮挡、光照等多种环境因素的影响,需要对图片进行数据增强。2、考虑到甲状旁腺的物理特征,本文将传统的目标检测方法中的矩形标注框替换为圆形标注框,提出了一种针对圆形物体的全卷积逐像素回归的目标检测模型(FCOSC),适用于腔镜甲状腺切除手术的场景。为了计算圆形标注框的参数,本文改进了 IOU Loss函数,并提出了 Center-ness-d分支。该模型在甲状旁腺数据集实验中的平均准确率高达37.9%。此外,该方法在公开的BCCD细胞数据集上也比常见的模型表现更好,可以达到70.4%的平均准确率。3、为了将实验结果进行详细的展示,本文做了具体的系统实现,研发了甲状旁腺数据分析研究平台。本文将Pytorch模型转化为ONNX模型,通过ONNXj s开发了一个Web系统。在这个系统中,主要功能是目标检测模型的结果展示,可选择在线资源或者通过本地上传资源进行推理检测,随后会展示对应图片及可视化检测结果。
其他文献
影像记录设备拍摄得到图像,其尺寸大小一般由其设备参数决定,当用户需要将这种统一尺寸图像在不同尺寸显示设备下投放时,通常发生图像被挤压变形或者不完全显示,严重影响到图像传递信息的准确性和视觉展示的友好性。图像重定向是一种旨在处理图像与屏幕尺寸不适配的图像处理技术,因此,对于以上现实常见需求场景,图像重定向是一个不可或缺的图像处理环节。本文研究了经典和基于深度学习的重定向方法,首先对经典重定向方法中重
学位
辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)是智能交通系统的重要组成部分,其基础算法模块包括车道线检测、跟踪和车前障碍物目标识别等。现有的基于嵌入式平台的辅助驾驶系统由于计算资源受限,尚不能满足实时性和准确性的要求。本文针对扬州市人工智能研究院的实际课题,以面向嵌入式平台的辅助驾驶系统作为研究对象,采用NVIDIA Jetson TX2作为计算平台
学位
复杂事物间的关联通常采用网络进行表示,随着网络规模的增长,事物的联系以大规模复杂网络的形式呈现出来,并行图计算就是将大规模复杂网络抽象成图再以并行的方式进行分析,通常采用图分区和图通信迭代技术。图分区是将图数据划分至不同的分区上;通信迭代的实现依赖于分布式图计算模型,在模型上执行图算法时需要多轮迭代,图上顶点之间会进行消息通信,是一种通信迭代过程。通信迭代时,每个顶点每次只传输一个消息的为单一的通
学位
多模态摘要旨在从文本、图像等不同的模态中精炼显著信息,并通过一种概括性描述来表示,近年来得到了国内外研究人员的广泛关注。目前的研究工作主要采用深度学习的方法,取得了瞩目的成果。但仍然存在一些问题:难以有效捕获图像中的关键目标特征;现有模型中需要优化的网络参数较多,导致训练时间较长;缺乏对图像内部噪声的屏蔽能力,导致模型难以准确刻画图像表示。本文针对上述问题展开研究,具体研究内容可分为以下三个方面:
学位
在纺织工业中,由于织机的机械故障、机器部件老旧、用于编织的纱线存在缺陷、布匹被过度拉伸或者表面存在褶皱等原因,加工出来的织物表面往往存在大大小小的瑕疵,严重影响到纺织工厂的生产效益。因此织物瑕疵检测成为纺织工业质量控制的重要环节。为了满足织物瑕疵检测模型需要具备高检测速度、高检测精度、低人工成本的实际需求,本文将深度学习方法应用到织物瑕疵检测领域中,研究并设计出适用于多种瑕疵类型与复杂纹理背景图像
学位
聚类算法是一种能将数据集中相似的点聚集起来的无监督学习算法。批量聚类算法虽然准确度较高,但不能有效利用上一次的聚类结果,每次运行都需要使用全部的数据集进行重新计算,导致资源浪费、耗时等问题。增量聚类指的是在新数据到达后,不必重新构建整个模型,只需要根据已经构建好的模型进行更新,这一特点非常适合于流式计算,但增量聚类算法准确度相对较低,并且无法满足流式数据需要实时处理的特点。流式聚类虽然能够实时处理
学位
信息技术的发展使得数据呈现高维化的趋势,而维度的增加会提升数据处理的难度,这一点在聚类分析中得以体现。由于高维数据的稀疏性和冗余性,许多传统的聚类算法在面对高维数据时会出现性能差的问题。为了解决这一问题,研究者们提出了许多新的聚类算法,子空间聚类(Subspace Clustering)就是其中比较有代表的技术之一。SubKMeans是一种基于K-Means的子空间聚类算法,其将原数据空间划分为一
学位
近几年雾霾天气频繁出现,给人们出行造成了极大的不便。雾霾天气下的场景能见度降低,进而导致一些成像设备获取的图像场景不清晰,不利于后续的场景内容分析。因此,图像去雾成为一个重要的研究方向,其旨在将有雾场景图像还原成无雾场景图像。本文围绕图像去雾这个主题,主要提出了三种基于深度学习的图像去雾算法。本文的主要研究内容如下:(1)提出了一种基于编码-解码结构的图像去雾算法。此算法首先使用三种不同卷积核大小
学位
机器阅读理解的目标是使机器具备理解自然语言文本的能力,已逐渐成为自然语言处理领域中的热点问题和重要研究方向之一。近年来,随着深度学习技术的兴起和大规模数据集的发布,该领域的相关研究取得了令人瞩目的进展。尽管如此,仍然存在诸多挑战如:以往方法中的问题-段落匹配结构难以准确刻画观点型问题中的语义关系;现有模型在多类型问题任务上尚不能很好解决答案类型多样化和数据不平衡带来的模型泛化性下降的问题;已有方法
学位
人体姿态估计,又称人体姿态识别,指对于给定人物图像或视频回归出人体关节点位置的过程。作为计算机视觉领域的热门研究课题之一,人体姿态估计在智能安防、人机交互、新零售、生物力学等多个领域有广泛应用。然而,当前人体姿态估计面临诸多难点。例如,视频背景复杂,人物相互遮挡,拍摄角度多变,光照强弱不均和人体姿态歧义等因素都会影响人体姿态估计准确度。现有的视频人体姿态估计模型主要利用光流或三维卷积网络来捕获视频
学位