基于小样本学习的病理图像细胞检测方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:chenbenxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代医学中,癌症作为掠夺人类生命的重要“元凶”之一,一直都备受关注。病理切片在癌症的诊断、治疗及预后过程中一直都发挥着重要的作用。医生通过观察病理切片中细胞的形态、位置和数量等特征可以对病情发展做出准确的评估。然而,病理图像本身包含复杂的组织环境和形态各异的组织细胞,病理医生在对图像中的细胞进行分析和判别时需要消耗巨大的时间和劳动成本。因此,实现计算机辅助检测病理图像中的细胞成为一个急需解决的问题。基于以上迫切需求,许多学者展开了病理图像分析方面的研究,并且已经取得了显著的成果。但是,这些成果都是建立在大量的学习样本之上的。深度学习是以海量的研究数据为前提的,一个表现良好的模型需要充足的标注数据作为支撑。相比于自然图像,病理图像中的细胞属于分布密集且尺度较小的检测目标,因此对细胞进行手工标注是一件非常困难的事情,在这过程中,不仅需要认真细致的标注手法,而且还需要专业的病理学知识。所以,标注完整的病理图像数据集往往不易获取。针对以上数据不足的问题,本文从小样本学习的角度出发,分别从数据和模型两个方面提出了相应的改进方案,以此提升模型在拥有少量标注信息情况下的表现。本文的主要研究内容如下:1.虽然标注完整的病理图像数据集难以获取,但是收集大量未标注的原始病理切片并不困难。基于此现实情况,本文将大量无标注图像加入到模型的学习过程中,通过预训练模型为无标注图像生成对应的伪标注,从而扩展训练数据集,使模型学习更丰富的细胞形态特征和分布特征。在生成伪标注时,本文采用了自适应阈值和细胞计数两种方法分别去除了病理图像中由于复杂的组织环境而产生的背景噪声,确保生成的伪标注都具有较高的置信度。这两种伪标注方法分别从不同的角度选择伪标注结果,基于自适应阈值的伪标注方法通过量化模型不确定性得到自适应的除噪阈值,该阈值被用于去除背景环境中的噪声因素,避免在背景区域生成错误的伪标注;而基于细胞计数的伪标注方法则在具有最高响应值的区域生成适当数量的伪标注,确保伪标注的准确性。在这两种伪标注方法中,自适应阈值与伪标注的个数都可以根据无标注图像中不同的细胞分布情况进行适当的调整,从而得到最准确的伪标注结果。同时,将伪标注用于模型再训练时,对无标注图像的特征映射进行了数据蒸馏,牺牲了少量低置信度的伪标注信息,从而保证了参与模型学习的数据的可靠性。2.针对病理图像中细胞分布密集甚至彼此重叠导致细胞识别困难的问题,本文从模型改进的角度提出了基于多任务学习的细胞检测模型。在多任务学习中,本文将细胞检测和细胞计数两个相关的学习任务整合到同一个端到端模型中,细胞检测与细胞计数共享同一个特征提取模块,通过多任务学习的方式实现特征共享。在学习过程中,细胞计数作为辅助任务可以为细胞检测任务提供细胞分布和细胞数量的全局特征,从而约束特征映射中的细胞数量,缓解因细胞重叠导致的识别错误,帮助细胞检测网络更好地定位细胞中心,使得模型检测结果更加准确。此外,多任务学习不仅能够提升细胞检测的效果,还可以通过共同学习的方式加快模型的收敛速度。本文将以上方法在三个不同组织不同染色的数据集上进行了实验验证,结果显示,加入大量无标注图像参与训练的模型检测效果相比于只利用少量标注数据进行预训练的模型具有明显的提升,而且该学习方法在三个数据集上都具有良好的适用性。此外,本文还比较了单任务学习(仅有细胞检测任务)与多任务学习的实验结果,在多数情况下,多任务学习的模型表现要优于单任务学习。而且,与其他半监督学习方法相比,本文的伪标注算法也具有优越的表现。
其他文献
蒙古族神话传说历史悠久、源远流长,其是草原人文历史中不可缺少的主要组成部分。从小家里的长辈就常常讲述那些有趣的故事,我听后如痴如醉,这是我年少时期最难忘的回忆,伴随着我的成长,一直影响着我的思想情感和精神世界,神话故事里那些生动的场景和丰富的情节,就像播放电影一般,呈现在我眼前,回荡在脑海和心田中,那些多姿多彩的人物、神灵、动物和植物等形象,都可以作为我雕塑作品的灵感来源,对我具有非常大的吸引力,
学位
美国作家福克纳大多数的文学作品,都表现了一个名为“约克纳帕塔法县”的地理空间中的生活。文学评论家马尔科姆·考利也在其选编的《袖珍本福克纳文集》中,将福克纳的一系列文学作品称为“约克纳帕塔法世系”。小说《八月之光》是归属“约克纳帕塔法世系”的早期作品,记述了约克纳帕塔法县的中心城镇——杰弗生镇所发生的故事。杰弗生镇是一个代表了约克纳帕塔法县的乡村自然风貌、城镇人文建设、以及居民们生活状态的地理空间的
学位
教师对学生的习作进行评价,书写习作书面评语是日常教学工作,而高效的评价可以使学生了解自己在习作中的优缺点,给予学生正确的指导,从而提升学生对习作的兴趣。但是在实际教学中,教师对学生们的习作评语存在许多问题。因此,笔者通过对小学高年段教师的习作书面评语进行研究,从中分析原因并找到有效策略,期望能够提高习作书面评语质量。本论文主要以小学高年段教师习作书面评语为研究对象,主要采用问卷法、访谈法、文献法、
学位
家园矛盾是影响家园关系和谐发展的重要阻碍,家园矛盾的预防策略能够指导主副班教师加强相互配合,共同预防不同阶段和类型的家园矛盾,是主副班教师加强班级管理和人际交往的行动指南。本研究的家园矛盾预防策略是针对家园矛盾的潜在阶段、萌芽阶段、上升阶段和消亡阶段进行的预防,旨在帮助主副班教师明确并掌握不同阶段家园矛盾的预防策略,预防矛盾事态进一步扩大。把握主副班教师家园矛盾及常见类型的预防策略,有利于指导主副
学位
文献纪录片有着历史记忆的功能,担任着诉说历史的责任,从衍生发展一直绽放着独特的魅力。在建党一百周年的节点,我国文献纪录片的创作出现了以往所没有的顶峰时刻,创作者通过历史的重要节点追溯中国共产党的百年征程,透视出中国共产党的先进性及科学性,将现实与历史交相呼应。它的题材选择、叙事方式和叙事语言等都表现出独有的创新与发展,展现出国家、社会日新月异的叙事价值。本文将《敢教日月换新天》《山河岁月》《绝笔》
学位
立足于传统文化本身,以内蒙古博物院文创产品为研究对象,致力于在文创产品设计层面传承文化基因、彰显文化魅力、提升文化竞争力。视觉意象作为阿恩海姆美学思想中一个较为抽象的概念,是人识认眼前事物时“心中的图纸”,是人以往经验中的“一般性形象”。研究旨在分析受众视觉意象产生原因,将视觉意象显性化,通过对文创产品视觉意象设计拉近文化与受众之间的心理距离,促进受众文化感知,建立文创产品与受众之间一定程度的共情
学位
《义务教育数学课程标准》(2011版)提出数据分析是统计的核心,但统计与概率的题型相对简单和固定,在中考中该部分的比例不大,因此教师们不重视,学生的数据分析观念培养不到位。本研究主要是为了调查初中生的数据分析观念水平,并根据调查结果提出相关的建议,加强教师对于该方面的重视程度,培养学生数据分析观念。本研究首先收集相关核心概念,对“数据分析观念的内涵”、“数据分析观念水平的划分”以及“初中生数据分析
学位
《普通高中英语课程标准》(2017年版2020年修订)明确指出英语课程的评价应反映以人为本的教育理念,着重评价学生的学科核心素养的发展状况,以核心素养的内涵与水平划分为依据,采用科学、合理的评价方式和方法,对教学过程实施有效监控,对学习效果进行适时检测。核心素养是我国当前应对科技发展和时代变化而提出来的新概念,对学生的学习与教师的教学都起着深远的影响,作为教学中的一个重要环节,课堂教学评价既影响教
学位
随着新一轮基础教育改革的推进,中学物理教育更加注重学生核心素养的形成与发展。科学探究能力的培养是中学物理教学中亟需落实的育人任务之一。实验是物理学的基础,它完全溶入于物理学的核心素养。为此通过物理实验教学有效促进课程教学质量、提高学生科学探究体验和能力的培养是很有意义的课题。笔者在攻读学位期间在内蒙古巴彦淖尔市XXX中学从事初中物理教学,学生的学情复杂、学困生较多、学生的厌学情绪明显。为了改进当前
学位
松柏类植物是陆生植物的重要组成部分,从晚古生代至中生代,一直处于优势地位,这种优势地位一直延续到了中生代白垩纪末,后来才渐渐的被裸子植物所代替。松柏类植物在植物进化的地质历史上占有极其重要的位置。无论是讨论古生代和中生代的环境气候变化、陆地植物灭绝,还是从蕨类植物时代到裸子植物时代的转变,松柏类植物都有着重要的研究意义。松柏类植物主要繁盛在中生代,保存埋藏下来的化石数量多,种类丰富;其中不仅含有大
学位