基于非均匀颜色直方图和CTAGD算法的图像检索研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wq52131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着多媒体技术和计算机网络技术的飞速发展,全世界数字图像的容量正以惊人的速度增长,无论是军用还是民用设备,每天都会产生容量相当于数千兆字节的图像。而在这些数字图像中包含了大量有用的信息,然而,由于这些图像是无序地分布在世界各地,图像中包含的信息无法被有效地访问和利用,这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的基于内容的图像检索技术(content based image retrieval)。本文首先介绍了基于内容的图像检索的背景、应用、发展历程、以及国内外现有的典型CBIR技术;然后详细阐述了基于内容的图像检索研究的各个关键环节。在深入研究图像颜色特征提取和相似性匹配算法的基础上,本文提出了一种基于HSI色彩空间累加直方图进行图像检索的方法,该方法使用符合人类视觉特性的HSI颜色空间,并将颜色压缩为72种具有代表性的色彩,又提出了一种具有重叠方式的图像分块方法,然后统计每块区域内的颜色直方图得到该图像的HSI颜色空间直方图,再计算各块的累加直方图,并根据相似度计算每块子图像的累加直方图和图像库中图像对应块的累加直方图的相似度,最后根据各块子图像的重要性进行加权,这样就有效地避免了全局直方图所带来的表示误差。同时,本文还提出了CTAGD(Combination of Texture and Gaussian Density)算法,其核心思想是通过在DCT域中提取一幅图像的高斯密度特征和在象素域中提取纹理特征并结合这两种特征形成新的向量来进行图像检索。其中高斯密度的提取主要是通过将一幅图像表示在极坐标中来获取这幅图像的几何中心,并计算8个极角(0,45,90,135,180,225,270,315)上的象素值的分段累加来作为一幅图像的特征值;而纹理特征的提取我们主要是通过计算图像在像素域中四个方向上的灰度共生矩阵来得到。在图像的相似性计算中,本文又提出了一种基于旋转相关系数并结合距离的图像匹配算法—MCMD法,这种方法首先计算查询图像的特征向量与数据库图像的特征向量的相关系数,得到相关系数排在前48位的图像,再计算查询图像和这48幅图像的距离,最后取距离较小的12幅图像作为检索的结果。在最后的实验中,我们选取了10000幅jpeg图像来作为实验图像库,与现有的一些图像检索方法的对比实验结果显示:本文提出的方法在图像检索的查全率、查准率及速度上都较同类算法有一定的提高。此外本文还介绍了提出的方法的各个模块的作用,实验界面以及对实验数据的分析和一些检索的实例。最后给出了本文的图像检索方法的一些缺点和对今后工作的展望。
其他文献
在过去的十年中,科学计算正从主机集中方式转移到并行和分布方式。近年来这一趋势更向着网格计算延伸。网格是当前并行与分布式计算技术的一个重要发展方向,其目标是实现对地理
长期以来,煤炭采掘行业产量难以核实,计量不准确,税务部门很难掌握其生产情况,税务部门在加强煤炭行业税收征管方面尽管采取了多种措施,但是煤炭行业税收管理中的问题仍没得到根本
基于语音的身份识别是指通过对说话人的语音信号的分析和特征提取,从而确定说话人是否在所记录的说话人集合中,进而确定说话人是谁的过程。随着计算机技术和信息化社会的发展,说
图像融合能够将不同类型传感器获取的同一对象的图像数据进行空间配准。并且采用一定的算法将各图像数据所含的信息优势或互补性有机的结合起来产生新的图像数据。这种新数据
彩色图像融合可以将多幅具有不同信息量的彩色图像融合为一张彩色图像,并且这张图像具有更多的可靠信息可供使用,在机器视觉及特征提取等多个方面都具有广泛的意义。在本文中,我
本文以智讯通讯公司的MIIS(Multi-Information Integration System)信息系统集成项目为研究背景,采用Web Service的系统集成技术,解决当前公司多个信息系统协同应用能力不足的
当前,机动车数量的急剧增加给交通管理带来了许多的问题。为了解决这些交通运输管理的难题,智能交通系统应运而生,成为目前国际道路交通和运输科技研究发展的热点之一。智能交通
目前电能质量业界缺乏统一的数据格式和规范,数据格式千差万别、互不兼容,这非常不利于信息共享和应用集成。另一方面,传统的电能质量系统更倾向于直接操作本地数据库或监测设备来访问数据,耦合性很高,不够灵活,更不易于扩展。因此,如何统一基础数据管理平台、设计合理的数据格式、实现跨地域获取数据成为亟待解决的问题。在电力行业中,对于数据质量的要求越来越高。可是从当前的实际情况来看,电能质量系统采集的数据一旦出
手写体数字识别是光学字符识别技术(OCR)的一个分支,在文件资料自动录入、金融税务系统数据统计、图像文本的压缩储存、自动阅读器、盲人助读器等领域有着广阔的应用前景.本
临床实践指南(CPG)是一种依据医学文献库中摘录的医疗证据和领域中专家的共识创建的文档,旨在提高医护质量和减少不必要的开支。基于CPG的医疗辅助决策系统是一种推广临床实践