图像直方图特征及其应用研究

被引量 : 0次 | 上传用户:airleon29
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像直方图由于其计算代价较小,且具有图像平移、旋转、缩放不变性等众多优点,广泛应用于图像处理的各个领域,特别是灰度图像的阂值分割、基于颜色的图像检索以及图像分类。图像分割是图像识别的基础,对图像进行图像分割,将目标区域从背景区域中分离出,可以避免图像识别时在图像上进行盲目的搜索,大大提高图像识别的识别效率以及识别准确率。基于灰度直方图的阈值分割计算简单,适合于目标与背景分布于不同灰度范围的灰度图像,特别是遥感图像。图像检索是指快速有效地从大规模图像数据库中检索出所需的图像,是目前一个非常重要又富有挑战性的研究课题。颜色特征由于其直观性、计算代价较小等优点,在图像检索中扮演着重要的角色,早期的图像检索算法也主要利用颜色特征,特别是颜色直方图。图像分类任务主要是指对一组图像进行一系列自动处理,最终确定图像所属的类别。图像分类具有广泛的应用前景,是计算机视觉的热点难点问题。针对图像分类的算法众多,其中以基于bag-of-words模型的方法最为经典有效。该方法首先利用提取的颜色、形状等特征构建视觉词典,然后在图像上统计视觉词的直方图,最后利用视觉词直方图作为特征运用分类器(例如非线性的SVM分类器)进行分类决策。对于应用于图像分割的灰度直方图,现有的灰度直方图形状容易受到噪声干扰,构建在其上的分割算法鲁棒性不足,迫切需要研究一种能消除噪声干扰且适应能力强的灰度直方图图像分割方法;对于应用于图像检索的颜色直方图,传统颜色直方图描述方法存在特征维数高、受光照影响、不能表达相近颜色间相关性及丢失空间位置信息的问题。因此,需要研究综合考虑多种因素的颜色直方图方法;对于应用与图像分类的基于bag-of-words模型构建的构建视觉词直方图,现有的基于bag-of-words的方法在视觉词的构造、直方图的统计上仍存在不足之处,使得最终得到的视觉词直方图不能很好地表达图像类别特征,因此需要研究新的基于bag-of-words的算法解决这些问题。本文具体研究了灰度直方图、颜色直方图、视觉词直方图以及构建在这些直方图上的图像分割、图像检索、图像分类应用。主要研究工作如下:1.针对一维阈值分割算法适应性差、容易受噪声干扰,二维阈值分割算法计算复杂度高的问题,提出一种基于区域划分的灰度直方图综合阈值分割算法。该算法利用像素灰度以及邻域均值组成二维空间,在此二维空间上利用区域划分的方法来构造一维直方图,再综合最小误差、最大熵以及最大类间方差(Otsu)三种经典的分割算法,构造新的阈值选取方法,最后利用获取的阈值指导图像分割。实验结果表明,本文提出的算法对比经典的一维阈值分割算法具有更强的适应性,以及稳健的抗噪性;同时与二维Otsu算法相比,适应的噪声种类更多,算法的计算复杂度小很多。2.传统的颜色距离度量通常采用最简单的欧式距离度量方式,但在HSV颜色空间上,由于各分量对颜色的贡献程度不同(H分量对颜色贡献度最大,S分量其次,V分量最小),因此这种简单的颜色距离度量方式不能很好地移植到此空间上。针对这一问题,本文提出参数化的HSV颜色空间距离,通过参数的差别来区别不同分量。然后人工标注颜色对间的距离的相对大小,并利用基于pair-wise的学习方法训练已标注的数据,最终学习出距离公式中的各参数,得到适合HSV空间的参数化的颜色空间距离公式。3.针对传统颜色直方图存在计算维数高、易受亮度变化影响、相近颜色缺少相关性以及丢失空间位置信息四个问题,提出一种基于聚类的空间颜色直方图方法。该方法首先对图像进行k-均值聚类,然后在聚类图上统计考虑空间位置分布的空间颜色直方图。同时,通过人工标注数据方法训练出HSV颜色空间的参数化距离公式,并在此之上给出空间颜色直方图的相似度匹配算法。实验表明,该方法实现简单,较好地反映了图像颜色特征,基于本文算法的图像检索效果比传统方法有所提高。另外,该方法适应性强,可根据需要标注相应的数据进行训练,从而满足多样性的主观颜色相似需求。4. bag-of-words是图像分类的经典方法,其核心问题是视觉词如何选择以及如何统计视觉词直方图。本文提出一种基于视觉词直方图的图像分类算法。该方法首先利用视觉注意机制应用在分类图像上,得到图像的显著度图。然后提取颜色、形状等多种图像特征,利用显著度图构造权值,生成词典,统计每个图像的视觉词直方图,再利用L1正则化的逻辑回归方法筛选特征,最后将筛选后的特征利用SVM分类器进行分类决策,最终得到图像分类结果。针对多组图像库的对比实验表明,本文方法具有较强的适应性,分类结果准确率高。
其他文献
服务贸易的发展程度已经成为衡量一国发达水平和国际竞争力强弱的重要标准。入世以来,我国服务贸易发展迅速,贸易规模不断扩大,国际地位不断提高。但是,我国服务贸易国际竞争力水
CT灌注成像技术是一种无创的功能性影像学检查方法,可较准确地反映肝脏和肝脏疾病的血流动力学变化。它在肝硬化的诊断、治疗、随访及判断预后中具有重要的意义。综述了肝硬
目的探讨影响产后母乳喂养的因素及相应的护理对策。方法回顾我院2009年1月—2011年12月期间944对母婴的临床资料,分析影响产后母乳喂养的因素,归纳总结行之有效的护理对策及
原发性肺部真菌感染是发生在机体免疫状态正常且无基础疾病情况下的肺部真菌感染,临床上最常见是隐球菌(新型隐球菌)和曲霉菌感染。随着该病的发病率、误诊率及死亡率的不断
民营企业自改革开放三十多年以来,经过不断的发展,数量上由不到十万家急剧增长到超过一千万家,民营企业在中国企业中的占比已经成为绝大多数,民间资本也因此急剧增加,在全社会总资
随着经济社会的发展和政治体制改革的推进,我国的政治体制得到了很大的改善,但权力制约和监督问题尚未从根本上得以解决,权力寻租的腐败现象严重地影响着党和政府的公信力。
腕管综合征是最常见的周围神经卡压疾病,临床上常用的辅助检查方法各有优势与局限性,而MRI不仅能清晰显示腕管各解剖结构,还能运用扩散张量成像(DTI)、Gd-DTPA增强成像等方法
当人们适应了互联网为生活带来的便利,人们已经无法想象一个没有计算机没有互联网的生活会是什么样。随着互联网在人类生活中的普及,它带动着其他的行业的迅速发展。电子商务
研究目的:检测汉族人群中缺氧诱导因子1α基因第12号外显子是否存在C1772T多态性,研究其与2型糖尿病肾病是否存在相关性,以探讨糖尿病肾病可能的遗传背景。研究方法:收集2012年6