图像检索中的高斯混合聚类算法研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:paokahh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高斯混合模型能够用参数化的方法描述样本空间中的数据分布,将高斯混合模型的参数作为图像的特征具有简洁高效的优点。层次性图像检索在图片高斯混合特征的基础上通过聚类得到类的高斯混合特征。层次性高斯混合聚类算法能将复杂的高斯混合特征聚类成比较简单的混合模型,检索的时候可以先查找类,然后在类中查找目标图片,这样可以大大降低时间复杂度。层次性图像检索的核心是高效的层次性聚类算法。聚类分析用来探索未知数据的内部结构,为决策服务,在各个领域有着广泛的应用。高斯混合聚类将高斯成分当作样本空间中的基元,借鉴经典聚类算法的思路,将复杂的高斯混合模型聚类成简单的高斯混合模型,适合于处理高维空间中的大样本数据集,是对经典聚类算法思想的推广。本文主要研究了如下两种混合聚类算法:一种是由N.Vasconcelos提出的层次性期望最大(HEM)算法。HEM算法是EM算法的推广,但是HEM算法没有充分考虑混合成份之间协方差的差异,使得聚类的时候出现协方差大的混合成份过度扩张,导致最后聚类得到的混合模型不能很好的反映类的内部结构。本文提出一种改进的HEM聚类算法—cov-HEM,摒弃传统的分裂算法,采取引入协方差因子平衡后验概率即隶属度的方式,增强小协方差成分的影响,抑制大方差成分过度膨胀。另一种是Slonim提出的一种基于信息论的凝聚式信息瓶颈(AIB)算法。AIB算法是凝聚算法的推广,但是AIB算法在聚类时采用的Monte-Carlo仿真公式却是值得商榷的。本文证明了此Monte-Carlo仿真公式与信息瓶颈原理的矛盾性,并提出了概率密度满足高斯混合分布时的解决方案,即将高斯混合分布时的概率距离度量引入到AIB中的相似性度量;同时将HEM算法中期望步骤中更新高斯混合成分参数的思路引入AIB算法,用来求每次合并得到的新的高斯成分的参数。利用类似的思路还可以将其他经典聚类算法进行推广。图像检索实验验证方案的合理性和有效性。
其他文献
数字水印技术作为信息隐藏理论的一个重要分支,是目前信息安全领域一个新的研究方向,在数字作品版权保护、保密通信等领域会发挥重要的作用。进一步提高空域算法的鲁棒性,通
现有的Ad hoc网络低能耗协议中,多数是针对单独的数据链路层或网络层进行协议设计,而没有根据网络五层协议栈进行设计,良好的Ad hoc网络协议需要上下层互相协助,现有的Ad hoc网络
随着Web技术的普及和信息技术的发展、推广与应用,以图像、声音和视频为主的多媒体信息迅速成为信息交流和服务的主流,现代信息处理的对象和方法都有了很大的变化。大量各种
随着信息技术的发展,各行各业信息化程度越来越高,随之而来的是对系统功能、性能等方面要求的日益增多。传统的网络开发模型,如C/S架构和B/S架构,或是在B/S架构基础上最新发
学位
当前,随着网络的高速发展,以及网络的突发业务流量的急剧增加,网络应用系统的性能已经成为人们关注的焦点。深入研究表明,在真实的网络应用环境中,自相似模型更适于描述真实
电子选举是密码学的重要应用方面,与传统的人工选举相比,电子选举可以节约大量的人力物力,具有明显的优点。目前已发展的电子选举协议的安全性都依赖于中央机构,这就要求投票
随着信息科技的高速发展,解放军大力加强了部队各方面的信息化建设。解放军某部针对新时期干部管理特点,基于成熟的目标管理理念,并以某设计研究所为试点研制和开发了基于B/S
随着并行计算的规模越来越大,超级计算机的规模扩展到成千上万的独立节点,这意味着硬件更容易在运行时间较长的任务时发生故障,已经有结论表明超过10万个处理器节点的系统在
伴随着数据库和网络技术的快速发展和迅速普及,在高校和企业内部使用的不同业务系统,由于是在不同时期,采用不同的技术标准和开发平台来建设的,信息孤岛现象日益严重,综合集