【摘 要】
:
白内障是当今发病率和失明率最高的眼科疾病之一。对预防失明来说,在早期及时发现并准确诊断出白内障尤为重要。临床白内障诊断往往需要眼科医生专业的知识和丰富的经验,但贫困和边远地区的白内障患者通常因为缺少专门的眼科医生而错失了诊治的机会。深度学习技术发展至今,在许多图像分类任务中都得到了广泛而成功的应用,然而,在白内障的自动检测任务中仍然存在着巨大的挑战。这是由于白内障及眼部B超图像的两个特点:首先,白
论文部分内容阅读
白内障是当今发病率和失明率最高的眼科疾病之一。对预防失明来说,在早期及时发现并准确诊断出白内障尤为重要。临床白内障诊断往往需要眼科医生专业的知识和丰富的经验,但贫困和边远地区的白内障患者通常因为缺少专门的眼科医生而错失了诊治的机会。深度学习技术发展至今,在许多图像分类任务中都得到了广泛而成功的应用,然而,在白内障的自动检测任务中仍然存在着巨大的挑战。这是由于白内障及眼部B超图像的两个特点:首先,白内障的病变区域位于眼球中的晶状体内,而在眼部B超图像中晶状体只占极小的一部分。其次,不同的白内障患者,晶状体的病变特征和区域也是不尽相同、多种多样的;且与正常晶状体的眼部B超图像十分类似,这导致了白内障眼和正常眼的眼部B超图像之间只存在极小的差别,表现出极大的相似性。本文根据以上特点,提出了一个基于残差注意力的多模型集成方法,以用于白内障诊断。本文的主要贡献如下:1.构建用于白内障诊断的集成模型,由三个效果最好的分类网络和一个集成模块组成,相当于综合多名眼科医生的判断,以获得更可靠的诊断结果。2.使用目标检测网络,在眼部B超图像中定位眼球区域并去除无关背景的干扰。3.设计残差注意力模块,嵌入分类网络,使模型更加关注晶状体和病变位置,从而提高晶状体部分的注意力权重。4.基于临床眼部B超图像数据集的实验结果显示,本文多个注意力模型集成的方法能够自适应地关注眼球内发生白内障病变的异常区域,在测试集上达到97.5%的准确率,超过单个模型的效果。
其他文献
随着现代计算机视觉的不断进步和发展,三维重建技术引起了学术界和产业界的广泛关注,在模型缺陷检测、智能机器人视觉、3D打印等领域有着非常广泛的应用,尤其是对室内场景进行实时稠密的高质量的三维重建是机器人、增强现实等领域关注的重点。三维重建算法可大致分为双目立体视觉的三维重建和基于RGB-D传感器的实时三维重建。基于双目立体视觉的三维重建,一般是通过多个视角的观察数据帧和帧间的视差信息来计算出物体的深
随着测序技术的发展,生物大分子序列数据量也飞速增长。数据挖掘作为从庞大的数据中提取出未知、隐含及具备潜在价值的信息的技术,被广泛应用于生物信息领域,用于探索其生物意义。其中,三维基因组学是近些年来基因领域的研究热点,研究表明基因组的三维结构与基因的转录调控以及表观遗传存在相关性,然而物种间的基因组三维结构的比较分析尚未在植物中得到广泛研究。因此以杨树为例,使用数据挖掘技术对胡杨和新疆杨进行三维基因
染色体图像分类,是临床上进行染色体分析的关键步骤之一,在遗传疾病的诊断和肿瘤学研究中具有重要意义。得益于计算机技术的发展和进步,使用计算机进行自动化的染色体分类,成为了近年来的热门研究。染色体是非刚性物体,容易发生弯曲,弯曲的染色体会影响网络的精确率,需要对弯曲的染色体进行矫直。现有的染色体矫直方法主要分为切割矫直法和骨骼关联矫直法,这两种方法存在一些局限性:切割矫直法,通过切割图片矫直染色体,会
随着网络的普及以及大规模食物数据的涌现,为了有效获得所需的食物信息,食物计算领域的跨模态菜谱检索得到了广泛关注。跨模态菜谱检索是食物图像和菜谱之间的相互检索,跨模态菜谱检索的难点在于食物图像和菜谱之间的关系极为复杂:有较多的食物图像外观相似且部分图像存在着干扰信息;在烹饪过程中有的食物配料变得不可见或者配料外形会发生变化;烹饪指示中暗含着配料与食物成品图像的某种关系。现有研究方法存在的问题:1.由
三维探测技术具有广泛的应用价值,在地形获取、自主定位、实景模拟、工业生产等诸多领域具有重要的推广及理论研究意义。作为三维探测技术驱动核心的场景深度信息获取是计算机视觉领域的热门研究课题之一,近年来受到了研究人员的广泛关注。传统深度信息获取方法大多采用基于多视图的双目立体匹配或从运动恢复结构的方式,对输入图像及相机拍摄参数的限制要求较多,提高了深度信息获取的门槛。因此,采用更少场景图像输入、对相机硬
红外成像仿真技术能够有效克服时间、环境、地域的限制获取不同环境条件下的红外图像,传统基于场景建模的仿真方法存在建模复杂度高、建模时间长等缺点,随着增强现实技术的发展,在真实场景中加入虚拟仿真物体能够避免大范围的场景建模工作,方便快捷地生成红外仿真图像。为保证仿真图像的视觉效果更加逼真,需要重点解决虚实融合的辐射一致性问题,即虚拟景物和真实背景应具有一致的红外辐射。在真实环境中,探测器接收到的辐射值
互联网发展日新月异,在改变人们生活娱乐方式的同时,也拓宽了社交渠道。交流分享不再受到距离限制,但问题亦接踵而至,攻击性言论犹如附骨之疽充斥在网络世界中,破坏着绿色文明的网络交流环境。攻击性言论是针对特定个人、群体进行言语攻击或能引起观者不适的文字内容,常见于各种社交媒体平台。准确的自动化检测工具能有效遏制攻击性言论的泛滥,故研究聚焦于使用机器学习方法检测识别攻击性言论。攻击性言论相关子任务包括了检
随着知识图谱技术的发展与成熟,其作为一个结构化的知识库被应用到各个领域,尤其是在基于知识库的问答领域。知识库问答是其接受一个自然语言式的问句并经过语义理解后结合知识库返回答案,不同于传统基于关键字的检索式问答,知识库问答直接给出精准答案,不需要用户进行二次查找或推理,使答案获取方式更加简单高效。然而,目前知识库问答的整体准确率不高,其主要原因包括两点:实体名拼写不规范、问句上下文信息不足和知识库中
面部表情是一个人表达情绪最直接的形式之一。由于人机交互的发展,许多领域开始关注人脸表情识别。近几年深度学习方法显著提升了人脸表情识别准确率,但在实际应用中仍存在一些问题:首先,深度学习需要大量训练数据,但现有人脸表情数据库不足以训练出在实际应用中能产生可靠结果的深度神经网络;此外,不同个体的差异,如表达情绪的方式和表情强度的差异,也会给人脸表情识别带来挑战。现有大多数表情识别方法一般将表情分为离散
在教育领域,“个性化学习”一直是经久不衰的话题。受限于技术水平和师资力量,其一直未能在实践中得到广泛应用。近年来,快速发展的人工智能和互联网技术重塑了个性化学习,为其在实践中的广泛应用创造了契机。领域知识模型和用户特征模型是个性化学习的两个重要根基。在实践中,通常使用知识图谱来构建领域知识模型。实体识别是构建知识图谱的第一步。在教育领域,实体识别也被称为“知识元抽取”。在已有研究基础上,本文重点对