基于深度层次特征学习的大规模图像分类研究

被引量 : 19次 | 上传用户:pengpeng88888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图像分类逐渐成为图像处理和计算机视觉领域的一个重要研究方向,是机器学习和模式识别的基本问题。随着互联网与信息技术的不断发展,每天都有大量的数字图像通过各种渠道不断的出现在人们的生活中,因此,深入研究大规模图像分类问题具有非常重要的理论意义和实用价值。目前,深度学习在机器学习领域异军突起,获得了巨大的发展,相关的理论和实践成果层出不穷,在大数据处理平台上运用深度学习理论解决图像分类问题是近几年的研究热点。本文在大数据处理平台Hadoop的基础上,采用深度学习方法学习图像的深层次的特征,从而对大规模图像进行分类。具体内容如下:1.提出了基于分布式K-means的图像特征提取算法。系统的描述了单机Kmeans算法所要解决的问题及其执行流程,阐述了分布式K-means算法的基本思想和实现方法,K-means算法被广泛使用来构建视觉词汇的词袋,由于其实施方便和高效的特点,本文提出在大数据处理平台Hadoop的基础上,采用分布式K-means算法提取图像的特征,最终良好的解决了大规模图像分类问题。首先,通过分布式K-means算法计算出聚类中心,即字典,再通过设定的特征提取函数提取图像的特征,最后将学习得到的特征输入到分类器中对图像进行分类。本文在数据集ImageNet和CIFAR-100分别做了实验,研究了预处理(白化操作)操作对字典和图像分类准确度的影响,同时,在数据集STL-10上,对该算法的图像分类准确度进行了验证,通过实验证明,该算法可以达到良好的图像分类准确度。2.提出了基于深度层次特征学习的大规模图像分类算法。采用深度学习的思想,从底层的原始像素开始,做底层的抽象,逐渐向高层进行抽象迭代,最终得到了具有更高抽象性的图像特征,同时,结合分布式处理思想,将算法进行并行化处理。本文提出的模型具有5层,每一层都具有相似的结构,即预处理、图像特征提取和图像特征选择的过程,前一层的输出作为下一层的输入,通过每一层的迭代,在最后一层得到更能准确表达图像的特征,最终输入给分类器进行图像的分类。同时,在数据集ImageNet和CIFAR-100上分别做了实验,对学习得到的字典进行了比较,验证了预处理(白化操作),感受野的大小及其间的步长对图像分类准确度的影响,最终对图像分类准确度进行了比较,验证了该算法不仅能够解决单机系统所面临的计算资源和存储资源的瓶颈,而且能达到良好的图像分类准确度。
其他文献
走私是一种跨越国界的违法犯罪行为,是国际社会共同打击的对象。打击走私绝不仅是经济问题,而且事关改革、发展、稳定的大局。尤其是在西藏边疆少数民族地区,坚持不懈地开展
进入21世纪,绵阳市科技型中小企业得到了空前的发展,为绵阳市的经济建设和科技发展做出了巨大的贡献。然而,随着企业的发展,科技型人才的缺乏正逐步成为制约绵阳市科技型中小
乡村治理绩效的好坏直接关系到整个乡村基层社会的稳定、发展和现代化转型,也关系着整个国家的现代化的实现,因此,乡村治理问题历来受到党和国家的高度重视,也是诸多学者进行
随着单脉冲技术的发展,人们对雷达的跟踪精度和速度提出了更多的要求,毫米波频段的单脉冲馈源有信息容量大,处理数据速度快的优势,因此得到愈来愈多的重视。本文理论分析并设
网络健康信息的传播效果体现在用户如何解码信息并形成相应的态度及行为倾向上,这种“自助式”的信息互动行为以网络自助医疗为代表,反映了网络用户在面临某一健康问题时,仅
在低碳经济形势下的现代化农业发展历程中,新型肥料受到越来越多用户的关注,高效型与环保型特征是此类肥料的最大亮点。中央一号文件明确提出“要积极地发展新型肥料等新型农
目的探讨心可舒片治疗不稳定型心绞痛的临床疗效和血脂影响。方法将63例心绞痛患者随机分为常规治疗组(对照组,31例)和心可舒片治疗组(治疗组,32例)。分别于治疗前及治疗后12周、
<正>相较于出现较早的城市公共自行车,共享单车的出现势必对其产生了一定影响。究竟这种影响是好是坏,业界专家和百姓各有自己的看法。共享单车"火"在哪儿?共享单车的火爆速
众包任务分配就是将众包平台中合适的任务分配给合适的众包方,以充分利用众包方的能力资源,提高任务的完成进度。针对众包平台中的任务分配问题,结合多Agent技术,提出一种基
为了消除掺铒光纤放大器的放大自发辐射噪声对分布式光纤温度传感器测温精度的影响,采用精确的修正公式进行温度解调是一种有效手段。通过分析掺铒光纤放大器的放大自发辐射