基于各向异性膨胀卷积的图像识别方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:wuming66666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人类获取信息的重要方式,随着社会信息化程度的日益提高,自动识别图像的需求也变得越来越迫切。由于互联网和移动互联网的快速发展,网络中图像数据呈现出爆炸式的增长,而传统模式识别方法在海量图像数据集上的识别效果无法令人满意,研究者们提出采用卷积神经网络(Convolutional Neural Network,CNN)来进行图像识别,其中,卷积是最为关键的组件。现有的卷积如普通卷积、膨胀卷积和可变形卷积,在图像识别中取得了不错的效果,但仍存在一些不足,如:普通卷积的感受野范围受到卷积核的限制,不够鲁棒;膨胀卷积会形成一个规则的感受野,不足以应付物体表观特征产生的各种变化;可变形卷积的感受野的形状的不能快速变换,不能起到精确定位目标的作用。为解决上述问题,本文对以上各种卷积进行了深入的研究,独立完成了以下工作:(1)在普通卷积、膨胀卷积和可变形卷积的基础上,提出了各向异性膨胀卷积(Anisotropic Dilated Convolution,ADC)。各向异性膨胀卷积的优势在于继承了以往普通卷积、膨胀卷积、可变形卷积的优点,是一种更加泛化的卷积形式,其他卷积可认为是各向异性膨胀卷积的一种特例。各向异性膨胀卷积可形成不规则感受野,能根据像素点所在位置和自身特点灵活变形,在通过膨胀率快速扩大感受野范围的同时,又可通过偏移量的学习使感受野范围更好地拟合所识别目标,从而起到精确定位目标的作用。(2)基于各向异性膨胀卷积,建立了各向异性膨胀卷积网络(Anisotropic Dilated Convolutional Network,ADCN)。各向异性膨胀卷积网络是在基准网络(如:VGG、ResNet等)上使用各向异性膨胀卷积替换普通卷积或者膨胀卷积得到的网络,与基准网络相比,各向异性膨胀卷积网络可保留有效信息和去除无效信息,以减少空间信息的损失,能提取出更鲁棒的特征。本文在七个数据集(MNIST、CIFAR10、CIFAR100、SVHN、STL-10、LFW、ImageNet)和四个基准网络(VGG、ResNet、WRN、DRN)上进行了实验。首先,验证了各向异性膨胀卷积的可行性和有效性;其次,通过实验确定了采用各向异性膨胀卷积的最佳网络层;最后,将各向异性膨胀卷积网络应用于图像分类和目标定位。实验结果表明:各向异性膨胀卷积网络的效果均好于基准网络,并在MNIST和STL-10的图像分类任务中取得了目前最好的效果。
其他文献
在时间截面和生境截面下,对植物群落多样性动态特征与环境因子进行灰色关联分 析.结果表明,山地荒漠草原中与植物群落多样性关系较大的环境因子为地形、土壤水分、土壤 有机
利用Quickbird和ETM影像对浙江省绍兴县北部平原220km2区域内50个村庄景观格局热效应进行研究。通过5种地类斑块共45个景观指数之间、景观指数与环境亮温之间的数量关系分析
介绍了混合痔手术后病人的疼痛机制及护理,详细阐述了术后病人的饮食护理、心理护理、促进舒适的方法、放松疗法、音乐疗法、栓剂疗法、冷敷法。尤其是中医护理技术在疼痛护理
教学是一个师生双边的互动过程,在这一过程中教师是主导,学生是主体,教师不仅要教书,而且要育人;不仅要抓好智力素质的教育,而且要抓好非智力紊质的培养.对学生非智力素质的
研究和评估输电线路的可用输电能力,对于确定电网的合理运行方式和优化配置电网资源具有重要意义,为此,将失负荷期望概率应用于可用输电能力计算,以河北南网重要输电线路为研
去年以来,随着国家宏观调控政策措施的贯彻落实,房地产开发投资过快增长势头得到了一定控制.但商品房价格上涨过快引起了各方面的关注.
在犬的上颌前牙区(右上颌侧切牙、左上颌中切牙)制造残根模型,将牙冠磨至龈缘下约平齐牙槽嵴顶水平,避免磨损牙龈软组织,术后第1、3、4、5周观察其牙龈生长情况,测量龈乳头至邻
本文在恩格尔系数理论和马斯洛需要层次理论基础上提出了"消费层次系数"概念,设计了消费层次系数及其运动规律的研究方案,使得消费结构研究从恩格尔关于商品类别结构研究发展为
新疆和田透闪石集合体(软玉)矿带约1 300 km,是世界上最大的软玉矿带。除传统上认识的白玉、青玉和墨玉外,近年来在皮山县发现的一种软玉呈红棕色(糖玉),较为少见。该糖玉矿
RTK是目前工程放样最常规的测量设备,但其一直受测量精度困扰,影响其使用范围。文章通过中铁二局第六工程有限公司十年的使用经验及实验研究,深入解析误差影响源,分析对RTK进