论文部分内容阅读
随着多媒体、数据库、海量存储、网络等信息技术的高速发展,数字图像正以数以亿计的数量不断增加。在这海量的数字图像当中,如何快速的对图像进行有效的组织和分类,成为目前最主要的工作。本文中提出了基于集成投影的二次分类算法(Secondary classification based on Ensemble Projection,SEP)对建筑风格图像进行分类。同时,由于卷积神经网络在图像分类方面有一定的研究成果,所以本文也用卷积神经网络对建筑风格图像进行分类。本文主要研究建筑风格图像分类问题。由于不同建筑风格之间具有一定的相似性,同一种建筑风格之间随着地域的变化具有一定的差异性,导致建筑风格分类存在一定的困难,传统的建筑风格分类算法不能很好的解决此问题。本文用上述两种算法,来解决这个问题。用SEP算法对建筑风格图像进行分类。建筑风格图像中存在树木、天空等非建筑物元素,这些元素将会降低图像分类的准确性。为了提取出建筑风格图像中建筑物元素,降低非建筑物元素对分类效果的影响,本文首先采用可变性的部件模型(Deformable Parts Models,DPM)对建筑风格图像数据集进行预处理,然后用SEP算法对预处理后的图像进行分类。SEP算法分为两部分:无监督的特征学习过程和有监督的分类过程。在无监督的特征学习过程中采用最大最小采样方法确定样本点,此方法利用样本点之间的最大距离来确定不同类,用样本点之间的最小距离来确定相同类,从而解决了不同建筑风格之间的相似性和同种建筑风格之间的差异性问题。在有监督分类过程中采用二次分类的思想对图像进行分类,二次分类的分界点用加权平均的方法确定。此外,本文还采用了卷积神经网络对建筑风格图像进行分类,对图像进行分类之前,也使用DPM算法对图像进行预处理。预处理后的图像输入到卷积神经网络中,经过多层卷积抽象组合底层特征形成抽象的高层特征,然后用高层特征进行分类。用SEP算法和卷积神经网络分别对十类和二十五类建筑风格图像进行分类实验验证。SEP算法结合SVM对十类和二十五类的建筑风格图像的分类正确率分别为0.7821和0.5535,结合LR的相应正确率分别为0.7716和0.5352。卷积神经网络对十类和二十五类建筑风格图像的分类正确率为0.7380和0.5550。