基于特征融合及聚类优化的词汇树图像分类

来源 :武汉大学 | 被引量 : 0次 | 上传用户:lcgbeyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,图像分类技术得到了飞速发展,其中较为热门的是词袋模型和可伸缩词汇树,通过将图像特征量化为视觉单词的方式达到分类的目的,具有很好的分类效果。但是,其中也存在着特征表达能力不强,聚类效果不稳定,特征表征不明确等问题。因此本文针对词袋模型和词汇树中的一些不足,进行了如下工作:(1)为提高词袋模型特征提取模块的特征表达能力,研究并实现了基于多特征融合的空间金字塔词袋模型。首先通过小波分析技术给DenseSIFT特征添加多尺度信息,并且在特征编码阶段使用空间金字塔模型增加特征之间的空间位置信息得到特征向量,然后融合颜色信息提高图像表达能力。最后在图像分类标准数据集上对本章的方法进行了不同特征、不同单词数量之间的对比实验,实验结果验证了该模型具有较高的分类准确率;(2)针对传统K-means算法过于依赖初始聚类中心且存在一对一硬化分的问题,提出了基于KSVD_MD的词汇树图像分类方法。首先,使用最大距离法选定初始聚类中心,并应用于K-SVD中实现特征聚类,通过将特征划分到多个类别进行加权表示,提高分类精度。然后,介绍了词汇树构建步骤及算法流程。最后,在标准数据集上进行实验,通过与其他算法的对比实验发现本章算法有效提高了分类准确率,相比于传统词汇树算法分类准确率提高了17%。(3)将多特征融合算法与KSVD_MD相结合用于词汇树分类模型中,并将此模型应用于瓶子商标分类中。对于商标这一类特殊图像,由于商标之间存在一代二代的关系,图像之间相似度极高。为了充分利用图像中的信息并达到高分类准确率,首先利用改进的词汇树对瓶子商标进行分类实验,但是该算法最终只能达到95.5%的分类精度;然后在词汇树分类基础之上,结合OCR文字识别技术进行重排序,最终达到了99.5%的识别精度,并且从旋转、噪声、遮挡多个角度验证了分类模型的鲁棒性较好。多特征融合主要将改进的多尺度DenseSIFT与颜色信息进行特征后融合,得到加权特征;KSVD_MD算法则在K-SVD的基础之上采用最大距离法确定初始聚类中心,用以增加聚类稳定性。两者相结合构建的词汇树结构在瓶子商标数据集上取得了优良的分类效果。
其他文献
为有效解决微细颗粒机械法规模粉体制备中团聚和粉磨极限等问题,采用空化射流冲击耦合磨介碰撞的微细颗粒制备方法。为探究空化冲击作用下的颗粒-磨介液相粉碎机理,以及有效
在啤酒的生产过程中不可避免会产生废啤酒,在当今提倡绿色生产,节约能源的背景下,将废啤酒进行利用,既可以减轻环境的污染,又可以增加啤酒行业的经济效益。本文以废啤酒为原
唇语识别技术是指仅根据说话人唇部运动的视觉信息,从而识别出其所说的文本内容,目前在唇语交互控制、静音信息输入、噪声环境下的说话识别和静音视频的处理识别有着重要应用
明清“得遗失物”律的相关规定最早可追溯到《尚书·费誓》中的相关记载,至迟在汉代出现了关于拾得遗失物“大者公之,小者庶民私之”的规定;唐代关于遗失物法律规定主要集中在“得宿藏物”和“得遗失物”两条;宋代沿袭,并制定相关例文,辅律而行;明律纂为“得遗失物”一条,内容未有明显变化,清律在沿袭明律的基础上增加律小注或律总注,进一步明晰律文的内容。本文共分为四个部分,首先在强调研究意义与研究方法的基础上,梳
在收集资料的前提下,通过野外勘查和室内研究工作,理清了该矿的地层、构造和岩浆岩特征,查明了矿体分布、形态、规模、产状、厚度和矿石质量,利用变差函数对该地区铁矿矿体品
本文针对可燃气体爆炸防控的严峻形势,在容积100L的密闭容器内开展了甲烷/空气混合物的爆炸特性及爆炸抑制研究。基于主动式抑爆技术,以粉体抑制剂作为抑爆介质、气体发生器
能源短缺和环境污染是全球性问题,储能技术对于提高能源利用效率和保护环境具有关键性作用。其中储能方式中的相变储热,可以解决能源供需之间的矛盾、克服可再生能源的间歇性
随着科学的发展与制备工艺的进步,研究人员们根据光学原理设计出了各式各样的传感设备与检测仪器,例如光学计量仪器、激光干涉式、光栅以及光纤式等光学传感器及仪器。光学传
随着互联网信息技术的飞速发展,信息过载问题愈加严重,用户难以在海量的数据中,快速、精确的定位到感兴趣的内容,因此为用户提供个性化信息推荐成为了目前的研究热点。传统的
过渡金属-氮-碳复合物(M-N-C)具有M-Nx位点丰富、电子结构可控、制备方法简单等优点,在催化领域具有广泛的应用前景。近年来,新型二维材料MXene因其具有优良的导电性、较好的稳