基于改进词袋模型的图像分类研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:huamin1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和科技的发展,以数字形式保存的图像数据迅猛增长,因此利用图像分类方法在较短时间内实现不同类别图像之间的准确表示和分类逐渐成为一大研究重点。图像分类是计算机视觉中的一项基础性研究,最近几年基于词袋模型(Bag of Words,BoW)的图像分类方法虽然获得了突破性进展,但仍然存在一些问题:单一局部特征信息缺失、特征量化误差较大、图像特征变现力不足等。针对这些问题,本文在原模型的基础上对其进行了改进并提高了图像分类的准确率,具体研究和改进如下:针对词袋模型中单一特征描述子信息缺失对分类准确率造成的影响,本文提出了多特征融合的图像分类方法。将局部特征融合后对其编码,获得图像的特征然后进行图像分类。实验结果表明,该方法可以很好的改善单一特征信息不足的问题,在一定程度上提高了基于词袋模型图像分类算法的分类准确率。为解决词袋模型中特征量化误差较大的问题,本文采用了分层特征学习和BoW模型相结合的图像分类方法。构建一个多层的特征学习结构分别对图像特征进行字典学习和稀疏编码,最后将各层特征连接起来作为图像的特征表示。该方法利用分层学习结构减少了特征编码过程的误差,提高了图像特征的辨别力,较为显著的提高了基于词袋模型的图像分类准确率。本文采用分层特征归一化方法,在特征归一化阶段充分利用图像的空间特性。在各子区域分别对特征进行归一化处理,并按照不同空间大小为其确定归一化系数,最后将各空间归一化特征进行系数加权连接后作为图像的特征表示,最后通过实验验证了该方法的有效性。
其他文献
不管是西方还是中国,写生一直是绘画艺术中必不可少的手段。但不管是什么类型的写生,都应该是第一自然。写生是进行油画创作的基础,是与生活亲密接触,感受它的气息,是同时调
氮杂环卡宾硼络合物(NHC-boranes或NHC-BH3)在有机化学领域迅速发展。它们不表现出硼烷的化学性质而是表现出自己丰富的化学性质,比如氮杂环卡宾硼络合物可以作为还原剂,自由基
运动物体检测是智能视频分析技术的基础。对于静止摄像机拍摄的视频序列:各帧的背景部分具有较强相关性,因此背景矩阵具有低秩性;同时视频中的运动物体相对整幅图像而言较小,
研究背景肝纤维化(hepatic fibrosis)是各种慢性肝病进展中由于过量的细胞外基质包括胶原等在肝内异常沉积造成的,并可进一步发展为肝硬化、肝癌。间质细胞如肝星状细胞(Hepa
目的:观察ARDS患者血浆线粒体DNA(mitochondria DNA,mtDNA)水平及其对ARDS严重程度及预后的预测价值。方法:单中心、前瞻性、观察性研究,以2016年05月01日至2017年01月31日期
人类的视觉是感知外部世界的重要途径,视觉的识别机理获得了研究者们极大的关注。现在利用计算机视觉技术模拟人脑进行外界事物的分析和探测面临着很大的挑战,尤其是在人类行
S-利卡西平是抗癫痫药物醋酸艾司利卡西平的关键中间体,以奥卡西平为原料,可通过生物法在水/有机溶剂两相体系中不对称合成S-利卡西平。采用限制碳源法从土壤中筛选出能将奥
由于低维金属有机配合物在结构上的特殊性与可控性及在光,电,热,磁,力,化学与生物功能众多领域的巨大应用价值,已经引起了广泛关注。特别是在磁性领域,已逐渐成为具有发展潜
随着信息科学技术的迅猛发展,当前可以接触到的视频正在急剧的增加,对得到的视频进行自动的视频序列分类在视频分析中正在得到越来越广泛的关注。视频序列分类已经广泛的应用
微信自从腾讯于2011年1月推出以来,发展极其迅速,至今已经积累了海量的用户群体。如何在微信平台上进行营销才能达到良好的推广效果也成为了业界关注的焦点。然而,无论学术界