基于CNN特征集成学习的图像分类技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:z_asdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是一种根据图像的视觉内容将其自动划分到预先定义好的不同语义类别的方法。它是计算机视觉领域中的一项重要任务,是场景识别、目标检测、图像检索、视频检索等视觉任务的基础。图像分类,不仅具有重要的研究意义,而且具有重要的应用价值,例如:基于图像分类的色情图片检测、疾病诊断,分别在互联网内容净化、医疗领域发挥着重要作用。图像分类的关键在于提取鲁棒性好、区分能力强的特征并选用合适的分类器对特征进行分类。  本文围绕着图像分类,分别从特征提取、分类方法两方面,进行了研究。主要取得了以下研究成果:  (1)提出了一种稠密多路卷积神经网络  目前分类性能最好的卷积神经网络(CNN)是稠密网络(DenseNet),其精度受到其基本模块表达能力的限制。为了学习到分类精度更高的特征,本文针对DenseNet的基本模块作了改进和优化,提出稠密多路卷积神经网络(DenseXT),利用残差网络(ResNeXt)多路变换的优点增强DenseNet网络的表达能力,从而使该网络具有表达能力强、内部信息流动充分的特点。实验结果表明该网络能够以不到DenseNet50%的参数取得与DenseNet相当甚至更高的分类精度。  (2)提出了一种基于CNN特征的集成分类方法  传统集成学习方法,采取分而治之的策略,训练多个子分类器,具有较高的训练和测试效率,并且多个分类器之间互为补充,因而相对于全局分类器具有更高的识别精度。鉴于CNN具有语义特性,因此本文提出了基于CNN特征语义划分的集成方法。该方法根据CNN特征的每一个维度,将训练集划分成多个子集,在每个子集上训练分类器。为进一步提高训练和测试效率,我们采用线性SVM,替代传统的RBF核SVM作为子分类器。在ImageNet数据集上的实验表明:该方法相对于采用线性SVM作为子分类器的稀疏集成学习方法,识别精度相当,模型大小降低约20%;相对于采用RBF核SVM作为子分类器的稀疏集成学习方法,精度略低,但速度大幅加快,模型大小显著降低。  (3)构建了一个图像分类系统  在上述研究的基础上,将用于特征提取的稠密多路卷积神经网络和用于分类的基于CNN特征的集成分类方法结合起来,构建了一个图像分类系统。实验结果表明所设计的图像分类系统具有较高的分类精度。
其他文献
可穿戴智能移动终端的发展,使得接触式手势识别方法难以直接应用于屏幕较小的可穿戴设备。基于超声波的手势识别方法利用可穿戴设备内置的传感器实现对用户手势的识别,具有设备
新信息、新产品、新服务每天都在不断被推上web,同时,用户的种类、数量和关注点也在增加。一方面,用户已经疲于以“大海捞针”的方式搜寻信息,另一方面web网上的服务商也在不断设
论坛帖子和近规范化文本所承载的丰富信息为很多网络应用提供了宝贵的基础数据。同时,基于模板的信息抽取方法具有抽取准确率高、抽取速度快等特点,是业界常用的信息抽取方法。
在分析防火墙和入侵检测系统缺陷的基础上,深入研究了能够弥补防火墙和入侵检测系统缺点的全新的安全技术一一入侵防御系统IPS.设计并实现了基于网络的入侵防御系统.对当前入
随着Internet以及电子商务的发展,人们对信息安全的需要越来越迫切.为了保证互联网上信息传输的机密性、真实性、完整性和不可否认性,防范电子交易及支付过程中的欺诈行为,必
该文的目标在于研究异构生物信息数据源的集成与互操作技术,在综合和参照现有系统的基础上,主要的工作如下:●综述了现有的生物信息源集成方法,指明Mediator-Wrapper是有效的
OpenMP是面向SMP体系结构的并行编程标准,MPI是面向MPP体系结构的并行编程标准.随着主流超级计算机系统由SMP向MPP过渡,OpenMP必然向MPI过渡.但是它们之间差异很大,手工转化
基于块匹配运动估计与补偿的压缩方法是应用最广泛的视频压缩技术,已被各种编码标准采用.基于模型的压缩方法是一种高级的视频压缩技术,能在保证图像质量的前提下,获得极高的
Web Services作为一种基于Internet的分布式组件技术,在动态电子商务环境中体现出越来越重要的作用。本文主要对Web services体系的核心技术和安全规范做详细分析,在这基础上提
随着国家教育事业的发展,计算机网络技术的不断完善,远程教育的方式越来越被人们所接受,为了更好地检测出学习人员的真实水平,各个考点都推出了各自的考试系统。这些考试系统有的