基于超声图像的甲状腺结节特征提取及描述生成算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ade4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甲状腺结节是临床常见病和多发病。在临床中,普遍采用超声成像技术对甲状腺结节成像,生成的超声图像是医生对甲状腺结节进行诊断和治疗的重要依据。在临床中,超声图像通常由训练有素的专家阅读,他们通过撰写文字报告来描述患者的异常和疾病。超声图像的阅读和超声报告的撰写花费了放射科医生大量的工作时间,而且由于医生的时间和精力有限,会出现漏诊和误诊的情况。因此,医学超声图像报告的自动生成技术,即为一张超声图像自动生成一段描述其内容的自然语言,受到了人工智能领域的广泛关注。为了实现这个目标,本文基于医学超声图像,在甲状腺结节分割算法、甲状腺结节的医学特征提取方法以及甲状腺结节图像描述自动生成算法这三个方面进行了研究,具体包括了以下几部分工作:首先,超声图像中甲状腺结节的分割算法研究。针对甲状腺结节分割任务中存在的类别不均衡问题,我们从调整损失函数和优化数据集两个角度出发,搭建了基于U-Net的模型级联框架,将甲状腺结节分割分解为两个分割任务,先粗略分割,再以粗糙点为基础进行精细分割。我们搭建了一个甲状腺结节图像分割数据集来检验我们模型的有效性,结果表明我们搭建的模型可以很好地解决甲状腺结节分割过程中存在的类别不均衡问题,提高分割的精度。其次,医学超声图像中甲状腺结节医学特征的选择与提取。针对超声图像特征在判断甲状腺结节良恶性过程中的重要作用和已有数据集的特点,选择了课题需要描述的甲状腺结节医学特征。针对医学图像的特点和深度学习存在的可解释性问题,提出了神经网络与传统医学特征相结合的特征提取方式,实验表明我们的方式可以准确提取甲状腺结节的相关特征。最后,基于超声图像的甲状腺结节图像描述自动生成算法研究。针对使用传统的图像描述模型在执行医学图像描述任务中存在的特征描述不准确的问题,本文基于编码器-解码器框架,设计了一个双输入单输出的甲状腺结节图像描述模型,可以综合图像的灰度信息和结节的轮廓信息。本文搭建了一个甲状腺结节图像描述的数据集,并做了相应的文本预处理,训练我们的模型,并用测试集检验模型训练效果,图像描述的准确率可以达到95%,远远高于传统的图像描述模型。
其他文献
近年来,我国人口老龄化趋势不断加速,老年人养老产业供需缺口持续扩大,养老服务种类繁多复杂,老年人对智能化的养老方式的需求难以满足,而物联网技术的蓬勃发展、物联网应用的大规模出现给智慧养老提供了新方案,但具体应用下物联网设备冗多繁杂、异构化,缺乏可配置、可扩展的统一接入方案,养老智能场景缺乏用户开发能力,难以满足老年人自定义需求。本文针对以上问题,研究物联网技术在智慧养老领域的应用。本文首先研究了基
随着计算机技术的快速发展,软件规模和复杂度也日益增大,随着开发需求的激增,为了降低软件开发的难度,缩短开发周期,研究学者们将目光投向了软件自动化开发上。在智能化软件开发中,代码补全实现了由编译器根据上下文中现有代码建议下一个可能的代码Token,例如方法调用或对象字段。近年来随着深度学习的应用,该方向涌现出大量科研成果,推进了软件智能化发展。在现有研究中,大多将代码视作语言文本送入自然语言处理中的
现阶段基于云端的视频监控技术日渐成熟,然而将监控设备采集到的图像或视频数据传输至云端或数据处理中心进行数据分析将会对监控网络的服务器与带宽造成较大负担,因此,面向变电站监控场景及智能化监控识别需求,结合人工智能图像分析与处理的方法,开展边缘智能计算技术研究至关重要。首先,分析并总结国内外有关目标检测技术与边缘计算技术的研究方案以及技术路线,同时基于现有边缘计算设备讨论模型搭建与边缘部署的可能性,分
文本作为沟通和协作的重要工具,在社会中扮演着重要的角色。同时在现代化社会中,由于图片和视频等数字化内容的快速发展,对其中的文本进行检测和识别往往可以提供给人们很重要的信息,利用这些信息能够辅助使用该信息的主体更好的完成任务。因此对于图片和视频中的场景文本进行检测和识别具有重要的意义。而在场景文本的检测和识别过程,对场景中的文本进行定位(即场景文本检测)是首要任务,因此场景文本检测具有重要的研究意义
近年来我国心脑血管疾病为代表的各类疾病发病率屡达新高,已经成为当前医学界重点研究课题之一。有研究数据表明,急性期丙烯率逐渐从最初的5%递增到15%,大部分死亡患者均因自身脑部病变及其他并发症所致。能幸存下来的患者当中有70%左右的患者都遗留有后遗症,必须长期服用药物来抑制病情,同时还需进行不定期复查,确保随时掌握病情。患有脑梗死的城乡居民不但痛苦还给家庭带来了严重的经济负担,在后期的康复中还需要长
作文智能批改的需求与日俱增,然而目前针对不规范书写的中文手写作文识别任务尚未有一套完善的解决方案。篇幅级识别任务大多是针对于英文数据集,还没有已经开源的中文作文数据集。因此研究复杂场景下的中文手写作文图像识别方法具有重要意义。首先为了快速收集大量数据,本文开发了一个半自动化的人机协作作文标注系统。利用百度开源的sdk,为用户提供了两种人机协作的标注模式,能自动帮助用户切分行、生成标签;系统支持多层
对于居家的糖尿病患者来说,将CGM屏幕显示的血糖曲线拍照发送给远程管理血糖的医生是目前常用远程医疗方式。考虑到医生需要较为准确的数据进行诊断,因此需要考虑CGM血糖图像通过视觉检测进行数据提取。本文针对CGM血糖仪屏幕图像设计了数据提取的视觉检测算法,同时开发了CGM血糖仪图像数据检测系统。本文的主要研究内容如下:由于需要针对不同型号CGM血糖仪设计不同的视觉检测算法,同时获得大量CGM血糖仪屏幕
如今软件产品有着非常广泛的应用,软件错误的发生可能带来很严重的后果,软件错误的定位显得更为重要。人工定位错误耗时又费力,自动化错误定位可以节约开发人员时间,降低调试难度。基于变异的错误定位不涉及程序依赖关系分析,是一种轻量级的错误定位方法,计算复杂度低,同时又定位在语句级别,定位精度较高。但是因为其会有大量变异体生成并执行,所以花费成本较高。由于现有的变异算子是为模拟程序错误而设计的,若变异算子可
学位
近年来,随着互联网和云计算技术的发展,我们逐渐从信息化时代向智能化时代迈进,互联网成为了最多源的信息采集平台。知识图谱打破了传统数据存储介质的局限性,并通过结构化的方式将实体和关系集成来自互联网上的多源异构数据,形成了统一化的语义网络结构。在数据收集、传输、探索和分析的基本技能中,最需要的一项是发现多源、多变量和流数据中的隐含的关系。无规范化的领域知识阻挡了本体和知识库的共享,由于本体的主观性和知