基于显著区域提取和pLSA的图像检索方法

来源 :西北大学 | 被引量 : 0次 | 上传用户:zhhaibin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和互联网技术的不断进步,数字图像资源正以几何级的速度增长,这就对如何进行大量图像数据的快速检索与浏览提出了新的技术挑战。在基于内容的图像检索(Content-Based Image Retrieval, CBIR)中,相当多的情况下用户并不关心图像全局相似与否,而更多关注的是图像中具有一定语义的区域是否相似。为了弥补全局特征在描述图像内容上的不足,本文提出了一种基于显著区域语义特征的图像检索方法。首先,利用谱残差和多分辨率分析方法提取图像的显著区域;然后,用概率潜在语义分析(probabilistic Latent Semantic Analysis, pLSA)从图像的区域集合中发现潜在语义模型;最后,根据潜在语义模型得到所有图像区域中潜在语义出现概率来构建显著区域的潜在语义特征,并使用该特征构建SVM分类器模型进行图像检索。本文以谱残差模型为出发点,阐述了显著区域提取、区域潜在语义特征构建以及基于显著区域图像检索的方法,主要研究成果如下:(1)显著区域的提取。根据人类视觉系统的特点,提出了一种融合谱残差和多分辨率分析的显著目标检测方法。该方法通过在不同尺度上计算图像的亮度、颜色以及方向特征的谱残差,构建多分辨率显著性图谱序列,然后用线性插值方法将不同分辨率的特征显著图叠加得到三个特征显著图,再利用k-均值聚类算法将每个特征显著图聚为两类,选择聚类中心距离最大的特征显著图作为最终的显著图,最后经过动态阈值处理获得图像的显著目标区域。融合谱残差和多分辨率分析的显著目标检测方法是本文的创新点。(2)区域潜在语义特征构建。在得到图像的显著区域之后,使用无监督的pLSA对这些图像区域所构成的集合进行潜在语义挖掘,以此构建区域潜在语义特征。(3)基于显著区域的图像检索。将正负样本看作两类,图像检索可看作一个实时分类问题。使用支持向量机(Support Vector Machine, SVM)对训练图像的区域潜在语义特征进行学习,得出训练样本集中每个样本对于决策的影响,即训练得到的支持向量,再以这些支持向量对测试图像进行分类检索,得到最终的图像检索结果。本文将显著区域提取方法和pLSA方法相结合,获得区域潜在语义特征,并将其应用于图像检索中,在一定程度上弥补了底层特征和高层语义之间的语义鸿沟。对比本文方法和基于全局特征的图像检索方法,实验结果表明,基于显著区域的图像检索结果更加准确。
其他文献
由于毫米波具有较好的穿透性,利用被动毫米波成像技术对隐藏在衣物下的危险物品(枪支、刀具、炸药等)进行识别、定位成为安检领域的又一研究热点。但是目前毫米波图像存在着
手语是聋哑人日常生活的主要语言,同时也是他们和正常人交流的主要方式之一。而大多数正常人并未经过专业的手语培训,使得聋哑人无法同其进行无障碍地交流。为了解决这个问题
语音是人类最便捷和自然的交流工具之 ,一方面它消除了人与人之间交流的距离隔阂,另一方面它也提高了人与机器之间交互的效率。然而,现实环境中无处不在的噪声也不同程度地影
连续相位调制(Continuous Phase Modulation,CPM)是一类包络恒定、相位连续变化的调制方式。由于包络恒定,CPM对信号幅度变化不敏感,所以尤其适合于采用高效非线性放大器的通信
卫星通信的重要性不言而喻,但卫星通信也面临着一些现实挑战,如路径损耗大、传播时延长。传统的通信机制如前向纠错(Forward Error Correction, FEC)和自动反馈重传(Automati
网络技术的发展促使人们热衷于在互联网上分享旅行经历,游记文本是一种主要形式。游记中蕴含着地点代表性知识(景观、风格、特色活动等),对旅行规划有很大参考价值。但由于游
随着工作环境和居住环境的提高,以及人们对环境的安全性要求越来越高,嵌入式硬盘录像机的市场需求量越来越大。同时,嵌入式技术、数据压缩技术、硬盘技术和网络技术的发展为嵌入
随着人民生活水平的提高,经济建设的发展,因强对流天气的发生而造成的损失也就更加严重。多普勒天气雷达作为探测强对流风暴天气的有效工具,自上个世纪六十年代以来,其探测结
随着网络技术和多媒体技术的不断发展,以及下一代网络(NGN)概念的提出,多媒体通信业务逐渐在因特网应用中占据主导地位,其中以VoIP技术的应用尤为突出。SIP(Session Initiati
近年来由我国近海海域赤潮引发的一系列的环境问题,造成严重的经济损失,引起了我国公众、政府和科技界的广泛关注。国家从不同层面对赤潮发生的机制、预警、预报与防治方法的