面向骨质疏松分类的卷积神经网络的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:haose1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来深度学习发展迅速,在不同领域都有着广泛的应用,尤其是图像分类方面效果显著,其中基于深度学习方法挖掘图像的显著性特征,在此基础上训练网络分类模型是其关键步骤之一。卷积神经网络(Convolutional Neural Network,简称CNN)是当前深度学习研究中最有效和常用的技术之一,可以自动进行图像特征的抽取,其参数共享和连接稀疏性的机制相比传统的神经网络不仅参数更少,效果也更加显著,被广泛运用到图像分类、目标检测、语音识别等任务中。由于卷积神经网络能有效地提取图像的显著性特征并用于解决分类、检测等任务,在过去的几年时间里,提出了不同类型的卷积神经网络模型。然而,在针对一些具体领域和业务中,尤其是医疗领域中的骨质疏松分类任务,由于受到医疗数据量少、干扰特征多、各个类别显著性特征相似等问题的影响,导致网络模型难以学习骨质疏松的显著性特征。同时,在网络模型分类层中的特征到类别的映射过程中,由于骨质疏松分类任务中干扰特征多,且骨质疏松与骨量减少的显著性特征非常相似,存在着显著性特征丢失的问题。本文工作主要针对骨质疏松分类任务中网络模型特征学习和特征映射过程中存在的问题,分别提出了可以解决上述问题的网络模型和特征映射算法。(1)为了解决骨质疏松分类任务中各个类别显著性特征难以学习的问题,本文设计了一个新的卷积神经网络TSCNN-DL(A Two-Stream Convolutional Neural Network with Dynamic Loss Function)。在TSCNN-DL中,本文提出了一种新的双流卷积神经网络来挖掘骨质疏松分类任务中各个类别的显著性特征,通过多尺度特征的挖掘和融合,降低了网络模型学习过程中显著性特征丢失带来的损失。同时提出了一个损失函数用于动态平衡各个类别在网络模型训练过程中的权重,使得网络模型在特征学习过程中会更加关注特征难以学习的类别进行学习。在实际的经过骨密度标注的医疗数据中,相比现有的基于卷积神经网络的研究方法,TSCNN-DL在精度、特异性、敏感性等指标中获得了更好的效果。(2)为了解决特征映射过程中存在的显著性特征丢失的问题,本文提出了一种特征映射算法FMA-MEO(Feature Mapping Algorithm Based on Multi-objective Evolutionary Optimization)。具体来说,首先基于分组处理的思想使用所设计的聚类算法将网络模型分类层前的特征聚为与类别数目相同的簇,然后基于多目标进化优化算法对各个簇中的特征进行优化并最终映射为期望的类别。在多目标优化算法中,本文提出了一种基于个体子序列的交叉变异算子,使得在优化过程中防止显著性特征丢失的同时能增加映射特征的多样性。同时,为了优化网络模型的训练效率,在对簇中特征进行优化时,使用多线程同时进行处理,大大提高网络模型训练效率。在骨质疏松的分类任务和Cifar-100中,对比当前研究中的特征映射方法,FMA-MEO取得了更好的分类效果。
其他文献
车牌是区分不同车辆的重要标识。随着车辆的不断增加和交通的日益繁忙,智能交通系统变得越来越重要。同时,车牌自动识别技术在智能交通系统中发挥着重要作用,如视频监控系统、停车管理系统和交通违章摄像头。然而,目前大多数方法都是针对特定场景下的清晰车牌,对于不受限制的远程交通监控场景中的模糊和低分辨率图像,仍然没有一个出色的解决方案,其识别精度可以达到实际应用的标准。在很难继续提高识别算法精度的情况下,我们
学位
基于卷积神经网络(convolutional neural network,CNN)的深度学习(deep learning,DL)方法发展迅速,在计算机视觉、语音识别和自然语言处理等领域取得了很多成功的应用,尤其是在图像分类和目标检测等方面,相比传统的机器学习方法,深度学习往往有着更加出色的性能。这是因为深度学习具有更多的参数和巨大的模型加持。但是,深度神经网络(deep neural netwo
学位
随着信息科技的飞速发展,摄像机得到大规模使用,视频监控系统在人们的日常生活中日益普及。在早先的视频监控中,摄像头采集到的图像数据大多是离散的,摄像机之间存在信息无法融合等问题。基于深度学习的目标检测与追踪则可以准确地反馈目标的坐标位置和目标运动范围,其在视频监控领域里有较好的应用前景。另外,一般视频监控的数据上传到数据中心缓存、分析和处理,传输过程需要耗费巨大的通信成本。鉴于此,本文提出基于边缘计
学位
近年来随着自动语音识别技术(ASR)水平的不断提高,在会议、教学以及车载语音等领域被广泛的应用。语音经过ASR转写会变成一串中文字符,但是这串中文字符并没有标点符号。这样的文本不便于读者的阅读,并且会对ASR后处理的其他任务(文本匹配,情感分析以及文本分类等)造成不好的影响。因此标点预测算法是ASR后处理技术中必不可少的。标点预测可以为没有标点的文本加上标点,增强文本的可读性。近年来,随着基于文本
学位
作为一种新型的软件架构风格,微服务以其可维护性高、可伸缩性强和发布周期短等优点受到了越来越多研究人员的关注和公司的应用。然而,微服务给软件项目带来优势的同时,也在应用过程中迎来了相关挑战,这些挑战主要分为技术和开发组织两方面。本文将主要聚焦于解决开发组织方面的挑战,目标是明确微服务的应用对开发组织带来了哪些影响,公司如何确定其开发组织是否适应微服务开发以及如何对开发组织进行调整以提高对微服务的适应
学位
显著性目标检测就是从图像数据中找出最吸引人的部分,这部分区域被称为显著性区域。当下的一些显著性目标检测算法对于特征信息的利用不充分,使得最终训练得到的模型在鲁棒性和泛化能力方面较差。许多显著性算法都是针对可见光图像的,但是当可见光图像受到阴霾、光照等因素影响的时候,使用热红外图像效果可能更好。考虑到热红外相机在这些因素下受到的影响相对较小,本文针对RGB-T图像进行显著性检测研究,通过结合可见光图
学位
指静脉识别技术凭借其采集方便、安全性高、实时性好、活体检测等优点受到国内外研究团队广泛关注。近年来,指静脉识别领域已经取得了阶段性进展,但在实际应用时,仍遇到了许多问题:(1)受采集技术和采集装置的制约,所捕获的指静脉图像噪声多、清晰度差、对比度低、存在小范围的位移和旋转、类内样本图像之间差异较大;(2)传统指静脉图像特征提取算法对图像质量要求高,对光照变化和位移旋转敏感。因此,本文围绕指静脉图像
学位
近些年,基于单目图像的三维人体关节点估计引起学者们的广泛关注,可应用于视频监控、行为识别、三维建模、人机交互等多个领域。但是其存在较多的研究难点,例如输入图像的暗光、模糊、遮挡,以及由二维数据重建三维结构的歧义性问题等。因此,本文研究由单目序列图像估计中间帧三维人体关节点的方法,主要包括两个阶段:首先利用二维人体关节点估计算法预测序列图像的二维人体关节点位置,然后以此作为输入数据回归中间帧的三维人
学位
人脸检索旨在从人脸图像数据库中找到与查询图像最为相似的人脸图像,是计算机视觉领域广受关注的课题之一。随着移动互联网的发展,人脸图像规模呈指数级上升,这对人脸检索的存储空间和检索时间有着很高的要求。由于哈希码存储空间小、检索时间快,研究人员将哈希技术用于人脸信息存储和检索工作。但由于人脸图像受光照、表情、视角、年龄等多种因素影响,难以获得“类内高内聚,类间高可分”的哈希编码。本文针对此问题,给出两种
学位
在智能交通管理中,对于车辆的身份识别离不开车牌检测技术的支撑,目前基于深度学习的车牌检测研究已经日臻完善,但是对于大型车辆而言,容易受监控视角和车身污渍等影响导致车牌检测算法难以获得车辆身份信息。根据道路安全法的相关规定,大型车辆需要在车尾区域喷涂非标车牌,于是本文通过研究非标车牌检测来解决上述问题。与标准车牌相比,非标车牌存在字符间隔大、成像质量差和背景复杂等挑战,加大了非标车牌检测任务的难度。
学位