基于内容图像检索中图像语义分类技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:junhao1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分类是基于内容图像检索(Content-Based Image Retrieval,CBIR)研究领域中一个重要而又有挑战性的问题。图像和视频正在成为多媒体的主要表现形式,将图像数据库划分为有意义的语义类别成为迫切的需要。传统CBIR技术试图通过分析图像视觉特征的相似性来检索图像,这不能满足普通人按语义检索图像的需求。基于低级图像特征将图像集合按语义进行合理的分类,会极大提高CBIR系统的性能。本文主要研究基于图像低级视觉特征的图像语义分类。 本文首先介绍传统CBIR的研究内容、系统组成和实际系统。详细阐述作为图像语义分类基础的颜色、纹理、形状、空间关系等低级图像特征,并讨论图像语义分类的主流技术。针对传统CBIR的不足,介绍了图像语义检索的主要技术。 图像语义模型是对图像整个语义表示和处理过程的抽象,也提供可行的研究方向。贝叶斯概率框架是一种将先验概率转化为后验概率的理论框架,通过形式化的图像分类概率框架可以将低级图像特征映射到已有的高层语义。 图像全局特征的表现形式多种多样,是图像语义分类的重要基础。本文基于单个图像全局特征提出一种新的图像语义分类方法,借鉴相关反馈机制的基本思想获得候选图像全局特征集合中具有最优“判别能力”的单个特征,还应用基于传统摄影学理论的空间分块策略。本文实现室内/室外和城市/风景两个图像分类器,并结合在大型图像数据库上的试验结果深入分析该图像语义分类算法。 多种图像全局特征也可以同时应用于图像语义分类。在分析使用多种图像全局特征优点的基础上,本文提出基于多种图像全局特征并和图像特征空间分布信息相融合的图像语义分类方法。结合多种图像特征和空间分布信息产生新的图像特征表示,并应用一种增量学习方法改进算法的性能。试验结果表明该算法特别适用于特征空间分布相对固定的室内/室外等具体图像语义分类问题。 图像局部特征往往对应着特定的语义类别。本文提出利用动态外观模型(Active Appearance Model)来描述同一语义类别图像中外观相似物体的方法。通过搜索图像中外观相似的“物体”进而分类和检索语义图像。针对人脸检测和红眼检测问题在家庭数字影集上进行试验,结果表明算法具有相当高的检索正确率。 最后开发原型系统TopAlbum,并介绍一些具体实现细节,论证了本文研究
其他文献
粉煤灰和煤矸石在道路工程中有很好的应用前景。为了推广应用粉煤灰和煤矸石,对水泥粉煤灰稳定煤矸石基层进行系统研究,本文阐述了水泥粉煤灰稳定煤矸石基层混合料材料组成设
自党的十八大以来,以习近平同志为核心的党中央高度重视教育工作,对教育工作作出了一系列重要部署,发表了一系列重要论述,深刻阐释了“培养什么样的人、如何培养人、为谁培养
采用最小生成树方法优化任务规划模型,将复杂的多目标优化问题解藕处理,先利用单旅行商问题模型缩小可行解的范围,然后建立多UAV协同侦察任务规划模型,然后利用蚁群算法求解
桂枝汤被柯琴誉为“仲景群方之魁”,临床应用颇为广泛。但缘于“夏无伤寒”之说,且西晋医家王叔和更有“桂枝下咽,阳盛则毙”之诫,夏季临证较少应用桂枝汤。然宋军研究员对于桂枝
根据“厦门第二西通道工程环境影响报告书简本”显示,该通道将以海底隧道的形式,穿越厦门西海域连接厦门湖里区和海沧区,路线全长903km,其中隧道长6.26km,连接线长277km。
童子诵经壶是宋代定窑的精品之作,向我们展现了文质彬彬的宋人淡雅端方的灵魂和极富创造性的玲珑之心。作为仿生壶承上启下的一环,童子诵经壶在造型、工艺、内涵等多方面都极
2011年1月18日,由斗山集团发起的斗山希望小学捐赠仪式在中国青少年发展基金会举行。本次活动向辽宁、四川、福建各捐建一所希望小学,共计捐款120万元。这是斗山支持中国基础教
得益于互联网信息技术的发展,影视字幕翻译作为一种文学翻译对中外文化交流的促进作用日益显著。由于其特殊的限制因素,影视作品的字幕翻译评价标准和翻译策略与传统的文学翻
摘要:商标译名作为企业进军国外市场的基石,对企业的国际竟争力具有至关重要的影响。奈达认为翻译的最终目的是在两种语言间达成功能的对等,并提出了“功能对等”理论,为当代学
融资租赁包含两种形式:一种是传统意义上的简单融资租赁;另一种是本文所述经营性融资租赁。简单融资租赁是一种全额偿付的融资租赁业务。在实际业务操作中.承租人在租赁期内缴付