基于卷积神经网络的手绘草图识别方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ren_sir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手绘草图从远古以来一直作为人们一种常用的沟通交流方式存在,近几年更是随着电子设备及触摸屏的发展而引起人们的广泛关注,也引起了关于手绘草图的一系列研究,例如手绘草图识别,手绘草图检索和基于手绘草图的3D模型检索等。其中手绘草图识别是目前很多学者研究的重点,也是本领域的基础。手绘草图的识别具有一定的难度,这主要是因为手绘草图与传统的自然图像相比有很多独特的特征,这些特征使得其识别起来比自然图像更有挑战。例如,手绘草图都是由非专业人士绘制,每个人都有自己的绘画特点和风格,这使得手绘草图具有高抽象性和夸张性。另外,手绘草图都是由黑色线条勾勒产生,没有相应的颜色和纹理信息,这也使得神经网络在进行特征学习时学习不到相应的特征而使图像识别更加艰难,影响识别准确率。虽然手绘草图有很多自身特点影响了其识别准确率,但它却有自己的优势,比如每个手绘草图都含有笔画顺序信息,且目前的数据集已将这种信息包含在内,更便于我们利用这种特征来提高手绘草图的识别准确率。在深度学习图像识别任务中,构建一个识别率高的网络除了需要一个好的网络结构之外,还需要使用大量的数据来进行网络训练,而现存的很多数据集数据规模较小,不能满足训练网络时对大量数据的要求,且当训练数据集过小的时候,网络很容易产生过拟合,影响网络的性能。现存有很多的数据增强技术,比如基本的翻转、旋转、随机切割、加噪等,可以通过这些增强技术增加训练集,提高训练模型的泛化能力。除此之外,针对特殊的数据集和图像,我们可以采用特殊的数据增强技术来扩充原数据集。在使用卷积神经网络进行图像处理时,最大的问题是训练一个网络的时间代价太高,即训练一个完整的性能较好的网络通常要花费几天甚至几个月的时间,这对于现实应用来说是一个很大的性能瓶颈。同样在我们的手绘图像识别中,训练一个性能较好的网络也需要很长的时间。随着大量高速计算硬件的出现和高性能计算领域的发展,我们可以根据CNN天然的并行性尝试将并行计算应用到CNN训练中。常见的并行技术有OpenMP、MPI、CUDA等,它们为并行计算提供了接口和平台,是目前使用最多的并行计算模型。本文针对手绘草图的特征提出了一种专门为手绘草图识别而设计的网络结构DCSN,DCSN网络是在AlexNet网络基础上进行改进,如首层采用了更大的卷积核来获取草图的结构信息,首层采用更小的步长来尽可能多的保留特征信息,通过增加网络层数加深网络深度等,这些改进有效的提高了手绘草图的识别准确率。为了解决网络的过拟合问题,进一步提高识别准确率,本文提出了两种数据增强策略,即小图形缩减策略和尾部移除策略。在进行卷积神经网络的训练过程中,我们发现网络的训练速度较慢,训练一个网络花费的时间较长,为了减少网络的训练时间,本文使用一种并行训练卷积神经网络的方法来完成DCSN网络的训练,该方法使用OpenMP和MPI混合编程模型,充分利用了OpenMP的节点内共享内存和MPI节点间数据通信的优势,完成节点间和节点内的两级并行,有效缩短了卷积神经网络训练的时间。
其他文献
随着当今城市公共交通急速发展,城镇地区机动车辆保有量激增,交通拥堵、停车难问题已经影响到人民的生活质量。各地政府纷纷通过拓宽、新修道路等方式缓解高峰期交通拥堵问题,相比之下,对停车难问题的重视往往还不够充分。尤其在西部丘陵城市旧城区,由于土地开发强度大,出现了不同程度的停车难、停车乱等公共停车管理难题,对城市道路通行能力造成更大负担,使得动态交通中的拥堵越演越烈。缓解旧城区停车难问题,根本在于提高
随着现代医学的发展以及医疗资源的优化配置,越来越多的婴幼儿先天性心脏病能早期确诊。随着麻醉技术的不断发展、体外循环和重症监护水平的不断提高,为不影响婴幼儿的健康成
我国已步入"众创"时代,职业院校积极回应。通过审视"双创"教育实践的现实生态和师生对于"双创"的基本认识,暴露出对"双创"内涵理解的偏差、重点投射的偏离以及实施方式的偏颇
马立克病(MD)是由马立克病病毒(MDV)引起的鸡的一种肿瘤性疾病,每年给全世界养禽业带来巨大的经济损失,多年来人们一直在致力于MD的防治工作,并获得了一定的成效,但根本问题
【正】 钟仕伦在《福克纳和沈从文的启示》(《当代文坛》1991年3期)一文中指出: 恩格斯早就指出过自然地理环境通过政治、经济对文学发展,特别是对作家审美观念所起到的重要
【正】 顾骧在《柔橹轻帆忆江南》(《当代文坛》1991年1期)一文中指出: “五·四”以后的一、二十年间,浙江一地涌现了一批文学大家。其中有文坛巨擘鲁迅、茅盾,有郁达夫
重复起诉,亦称二重起诉,一直是民事诉讼理论研究和司法实践中经常遇到的问题,且颇具争议。在我国大陆地区,禁止重复起诉有时等同于一事不再理原则,而在德国、日本及我国台湾
云南学生在学习越南语的过程中会习惯性地将地方方言的发音带入越南语发音当中,从而产生语言负迁移的现象。该研究试图通过对比云南方言的语音特性和越南语语音的特性,分析云
铁酸钇(YFeO3)是典型的稀土钙钛矿型铁氧体之一,具有自旋重取向、法拉第旋转等独特的磁性能,可应用于磁感应器、磁光电流传感器、光转换器等领域,铁酸钇还具有作为单相多铁性材
2016年9月15日,根据北京市“十三五”时期城市管理发展规划,“十三五”期间北京市将研究适时推进生活垃圾强制分类,新建生活垃圾焚烧厂和建筑垃圾处置场所,基本实现原生垃圾零填