基于内窥镜图像的多分类算法的研究与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:dailynice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国,现如今胃癌已经成为第三大癌症,并且每年都会有40万人左右深受胃癌所带来的伤害。目前,在临床上对胃癌进行诊断的常用手段之一就是内窥镜检查。胃癌在发病时较为隐匿、不易被患者所察觉,早期经常会因为没有明显的症状而导致漏诊的情况出现,并且还具备易转移、复发和预后差等特点。据研究表明,内窥镜检查可以显著的减少亚洲患者胃癌死亡率。在检查过程中产生的大量内窥镜图片需要由专业的内科医务人员去进行初步筛选,这对于医生的经验、精力、时间都有着较高的要求。此外,还存在着某些图片病灶不够明显或者有异常的情况,因而诊断难度较大。本篇论文主要研究对内窥镜图片进行分类检测并提高分类准确率的问题,主要工作如下:第一,文中所用的数据集由医生通过电子内窥镜采集,分为胃癌、胃溃疡、胃息肉和正常四类图像并且数量较少,因而通过三种数据增强方法来对现有样本进行处理,包括旋转翻折、Gamma校正和直方图均衡化。第二,随着人工神经网络的兴起,卷积神经网络已经被证明可以应用到图像分割、图像分类等场景中,它具有强大的特征提取能力。因此,文中提出了一个卷积神经网络模型GEINet(Gastric Endoscopy Image Net),并使用该模型去研究数据增强方法对内窥镜图像多分类问题的影响。迁移学习是使用卷积神经网络进行图像分析的一种方法,它能够针对已经在其他领域中训练完成的卷积神经网络模型,再次利用一些非源领域的数量不多的样本去进行微调,从而能够实现适应新领域任务的目标。文中采用了五种迁移学习的预训练模型来对内窥镜图像数据集进行训练,而后对得到的模型进行优化,通过对优化前后的模型进行对比,找到一种迁移学习预训练模型结合数据增强方法进行内窥镜图像多分类时性能指标较好的搭配方案。为了能够提升模型的泛化能力、减少过拟合的风险,文中对三组实验均采用了五折交叉验证,并使用五次结果的平均值作为实验的最终结果。实验结果表明,在针对内窥镜图像多分类的任务中,采用了数据增强方法后使分类精度提高了2.50%~11.62%。为了进一步提高性能,采用了五种不同的迁移学习预训练模型并设计了相应的网络,特别是在使用Dense Net201预训练模型,搭配旋转翻转、直方图均衡化和Gamma校正等数据增强方法后,准确率达到99.63%。经过详细的对比实验,表明使用数据增强方法结合迁移学习预训练模型可以得到较好的医学图像多分类问题的性能指标。
其他文献
背景:胼胝体是处于人类大脑中线位置的重要的白质结构,其功能为在人类进行活动时协调双侧大脑半球的运作,胼胝体的联合纤维在大脑半球中占据着重要的地位。胼胝体肿瘤在临床上最常见的是胶质瘤,其余类型的肿瘤有淋巴瘤、脂肪瘤等。胼胝体膝部及体部最常见于肿瘤生长,而临床上较少遇见胼胝体压部肿瘤。通常认为胼胝体功能重要,部位较深,手术难度较大,因此,对此处肿瘤行手术治疗被风险是大于收益的。然而伴随影像学技术的提高
推进课程改革几年来,我们结合实际,对临川传统教育文化的继承与发展进行了深入的研究,我们确定推进课改的总体思路是:按照"弘扬临川文化,谋划和谐发展,成就幸福人生"的教育发展理念,确定"一个中心"—以实施素质教育为中心;强调"两个统筹"——城区学校与农村学校的统筹发
期刊
随着计算机技术的不断发展,人类社会中的各个方面开始与之产生紧密联系。人们日常生产生活中产生的海量数据大多以电子化的形式存储在关系型数据库中,在对这些数据进行访问时,往往需要编写SQL(Structured Query Language)来对数据库进行操作。但是,SQL本质上是一种计算机编程语言,编写SQL需要一定的专业知识,此外,还需要了解所访问的数据库模式。通过自然语言来与数据库进行交互查询数据
目的:探讨硬腭粘骨膜、掌长肌腱、鼻唇沟皮瓣这一“三明治结构”在全下睑再造中的可行性。方法:收集2015年至2020年于吉林大学第一医院治疗的因外伤或肿瘤切除导致重度下睑全层缺损行全下睑再造的13例患者的临床资料,对其进行回顾性分析,年龄范围23~61岁,平均年龄为42.2岁,10例为男性(71%),3例为女性(29%),病变部位:左下睑7例,右下睑6例,所有均累及眼睑全层,修复下睑缺损的面积为3c
血栓性疾病,如中风和缺血性心脏病,依然是全球死亡率及致残率最高的疾病。血栓的形成是一个复杂的、动态的、多步骤过程,涉及到生物化学反应、力学刺激、血流动力学等多个方面。近年来,人们已经从这些方面出发做了大量的研究,以期全面地理解血栓的形成机理,更好地预防及治疗此类疾病。然而,无论是从实验、数值还是理论角度,这都存在着巨大的挑战。实验上,受体内测量精确性限制,观察结果的可靠性往往难以保证;数值上,受血
背景:甲基鸟嘌呤-DNA甲基转移酶(MGMT)的高表达是导致胶质瘤对替莫唑胺产生耐药的重要原因。近些年来有研究表明Wnt/β-catenin和NF-κB通路与MGMT介导的替莫唑胺耐药相关。生酮饮食在实验和临床研究中表现出较强的抗胶质瘤作用,但是其对于胶质瘤治疗过程中增强替莫唑胺疗效的研究相对较少。生酮饮食可以调控NF-κB和Akt通路,但是其对于MGMT影响的相关研究较少。目的:探究生酮微环境对
甲骨文是中国最古老的文字体系,它是汉字的起源,也是中华民族优秀传统文化的根。甲骨文识别的任务是确定甲骨文的字符类别,它是完成甲骨文释读的必要前提条件。目前,对拓片上的甲骨文进行自动文字识别工作主要依赖专家的特征工程。工作内容复杂且工作量大,需要大量的人工成本和时间成本。所以对甲骨文进行自动图像识别具有重要研究价值。目前卷积神经网络在图像识别域已经取得了很大的成果。本文利用卷积神经网络中的ResNe
国内外经济环境的不断变化加剧了国内企业之间的竞争,如何提升企业核心竞争力是所有企业所面临的关键问题。从企业财务的视角而言,财务管理贯穿企业经营中的所有主要经济活动,建立完备的财务内部控制体系是企业竞争力的重要保障,具有举足轻重的意义。电力行业是国家重要能源产业之一,关乎国家经济发展、工业发展及民生等多项重要领域,电力行业的行业封闭性使供电公司在财务内部控制方面存在很多隐患。本文以蓝天供电公司作为研
互联网的普及促进了复杂网络的发展,如何学习一个低维稠密的向量来表征复杂网络中的节点以便进行分析成为了一个研究重点。变分图自编码器凭借其强大的生成能力已经成为复杂网络表征的常用方法之一。然而目前变分图自编码器的研究存在两个挑战。1)已有的变分(图)自编码器及其变体大都假设隐变量服从标准正态先验或服从一个融入了很多专家经验的复杂先验,但是在很多实际情况中很难确定采用什么形式的先验或者先验概率很难获取。
传感技术的迅猛发展使得图像成像系统逐渐完善,得到的图像信息呈爆炸式增长。这些信息之间既有互补性,又存在较大的冗余性。图像融合技术可以将多幅图像由不同类型传感器或同一类型传感器的互补信息融合至一幅图像上,并在消除冗余信息后,生成一幅新的图像。融合后的图像能够弥补单一图像的不足,并且可以提高图像信息的利用率,获得更加丰富且精确的信息,同时借助获取的信息来生成高质量的图像。图像融合技术已经被广泛地应用在