基于空间信息词袋模型的图像分类

被引量 : 0次 | 上传用户:lxhcoolrr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前信息技术快速进步,图像数量与日俱增,伴随而来的是关于图像研究的众多课题飞速发展,如图像标注、3D重建、图像检索、图像分类、图像标签推荐等,其中图像分类研究已成为图像研究领域的热门课题。词袋模型作为图像分类研究领域中最成功的模型之一,已越来越受到大家的重视。但是,词袋模型的最大缺陷就是认为视觉单词特征彼此独立存在,丢弃了视觉单词之间的空间位置信息。研究发现,这种视觉单词之间空间信息关系对提高图像表示性能非常重要,丢弃后会很大程度上降低分类效果。本文针对此问题,提出解决方法,研究成果如下:1.针对词袋模型视觉单词特征中缺乏空间位置信息这一缺点,提出了空间矢量模型。该模型根据空间矢量原理,利用视觉单词的坐标位置,将图像视觉单词特征转化为空间矢量模型,用空间矢量矩阵表示图像。最终在图像描述中加入空间信息,进而有效地提高了表达图像的能力。2.根据空间矢量模型,将图像转化为视觉短语特征描述,以视觉短语直方图形式表示图像。并进一步提出视觉语言模型,该模型是在视觉短语特征形成后,与词袋模型的视觉单词特征进行结合,形成视觉语言特征,进行SVM分类。3.根据空间矢量模型,提出直接利用空间矢量矩阵比较的方式,并与词袋模型结合进行KNN分类。K值方面,采用交叉验证选择最佳K值;权重方面,通过测试图像矢量矩阵与训练图像矢量矩阵相同行数来分配权重,相同行数越大,对应权重越大。4.为了消除图像旋转对图像分类的影响,在空间矢量矩阵的基础上提出了矢量模的方法。矢量旋转时,矢量的方向虽发生改变,但长度不变。因此采用矢量的大小,即视觉单词的距离,来表示图像,就可以达到旋转不变性。本文实验在Caltech101和Caltech256数据集上进行,在Matlab环境中,利用本文方法进行图像分类,并与其它分类方法对比。实验采用的评价标准是平均分类正确率ACA和平均类别准确率ACP,采用的分类器是SVM和KNN。实验证明,空间矢量模型有效提高了ACA和ACP,具有很好的分类效果。
其他文献
创新创业教育已经成为大学的教育思潮,成为世界高等教育的一个关注点和时代特征的缩影,是衡量一所高校竞争力的重要指标。对培养高校学生创业能力有影响的因素很多,各因素之
从Total Pitch(TP)的理论含义与监控原理出发,通过对相同Device下Pitch量和TP测试Mark的更改,讨论了X方向以及Y方向TP的变化。通过相同Lay out不同产品和相同产品不同Lay out的
因艾滋病具有传染性和不可治愈性,在现实中,艾滋病患者受到歧视、平等权得不到应有保护的事例屡见不鲜。为了使艾滋病患者的平等权得到切实的保护,免于受到种种不平等待遇,使其可
从整体战略角度出发,将路网内所有交叉口作为研究对象,对交叉口与交叉口、交叉口与交叉口群、交叉口群与群之间进行有效的协调控制设计,实现整个控制区域内交通运行效果最优化,解
目的分析呼出气一氧化氮(FeNO)和超敏C-反应蛋白(Hs-CRP)测定在慢性阻塞性肺疾病(COPD)急性加重期病情评估中的意义。对象参照2011年卫生部发布的《慢性阻塞性肺疾病诊治指南(2011年
家养梅花鹿产品具有很高的保健功效,其中以鹿茸、鹿胎最为著名。随着市场需求的增加,鹿产品开发的进程骤然加速,然而在此过程中产生了大量的鹿副产品,包括鹿心、鹿肝、鹿脾、鹿骨
目的:通过对医疗保险重大疾病保障制度建设的历史沿革和发展现状进行调研和分析,结合长春市自身情况,借鉴国内外重大疾病保障制度建设的先进经验,探索适合长春市医疗保险发展的重
随着信息技术的发展,政府以及企事业单位急需一种基于互联网的网上办公系统,该办公系统应该集成在企事业单位的门户网站上且集信息管理和办公自动化与一体,能够实现企事业单位办
目的:探讨呼出气一氧化氮检测对疑诊哮喘患者的诊断价值,对初治哮喘患者治疗的指导价值及其与血浆嗜酸性粒细胞衍生神经毒素的相关性研究。方法:一、纳入我院门诊2012年8月至201