基于视觉信息和高层语义结合的图像检索方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:liangchq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图片标注的研究是实现基于语义内容的图像索引、检索及其它相关应用的最重要和最关键的一步,其目的是要在感性层面的视觉信息和语义层面的语言描述间建立一种精确的对应关系。因此,在进行基于内容的图像检索时,这些标注可以弥补高层语义描述和低层视觉特征之间的语义鸿沟。对图像内容进行标注是实现检索和浏览图像的一种重要方式,它能够返回给用户所有与查询标签相关的图像。然而,应用现有基于标签的图像检索方法所得到的图像,往往因为内容不相关或图像质量较差而令用户失望。我们认为语义相关性和图像质量是衡量图像检索结果是否令人满意的两个重要标准。本文中,我们提出了一种图像检索方法,它同时考虑了图像内容与查询标签的相关性以及图像质量。首先,我们根据图像内容与查询标签的语义一致性以及图像间的视觉相似性对图像进行自动排序。然后我们将每幅图像的质量评分和相关性评分进行线性组合,用以对检索到的图像进行优化排序,从而实现图像的相关性—质量排序。同时,我们在NUS-WIDE图像库进行的实验说明了本文所提算法的有效性。值得注意的是本文中只是采用了Flickr数据集,本文所提的标签查询结果的相关性质量排序方法是一种通用的方法,并且也适用于其他社会媒体网络,如Youtube和Zooomr。最后总结全文的工作,对下一步研究中难点、热点以及需要解决的问题进行了展望。本文对质量因子的提取只选用了几个简单的特征就获得了较好的效果,我们可通过设计较复杂的图像质量特征以获得更好的效果。另外,有效并自动地融合不同形态的特征依然是一个大难题,因此,未来一个可能的方向是通过学习一种中间的表示法来使得视觉内容和语义标签之间的相关性最大。
其他文献
高精度稳定平台可以有效地稳定视轴,保证侦察的实时高效。然而稳定平台系统中模型的变化与不确定性、转动系统的各种摩擦力、外界环境的干扰等多种因素会对其视轴稳定精度造成
学位
目前,已有不少科研机构以小型无人直升机为平台,开展视觉伺服以及飞行控制技术的研究。本文针对小型无人直升机的特点,完成对平台系统总体设计、建模、视觉定位以及鲁棒控制器设
现场总线控制系统是顺应智能仪表而发展起来的,利用现场总线技术,可以改进控制系统的结构,提高其通用性。在众多的现场总线标准中,PROFIBUS凭借其协议开放、灵活性强、传输速
新能源的开发利用业已成为世界各国能源发展的重要版块,其中风力发电技术相对成熟,因而发展势头十分迅猛,世界范围内风电装机容量不断提升,与传统火力发电厂供电模式不同,风力发电
随着人们生活水平的不断提高,制冷设备数量不断攀升,导致资源和环境问题日益突出。制冷系统日常维护和分析,对系统运行效果、使用寿命、尤其是节约能源具有重要的意义,近年来得到广泛关注和快速发展。而传统表盘式歧管仪由于读数误差、操作繁琐、功能单一,逐渐不能满足制冷系统日常维修维护的需求。集合压力表、温度表、数据记录仪、压焓图功能的工具能够大大提高现场制冷人员工作效率,也为节能分析提供更加真实有效的数据,具
能源短缺和环境污染已成为两大世界性问题,如何提高能源利用效率日益受到世界各国的重视。地源热泵因其高效、环保、运行成本低等特点正被普及,它作为一项快速发展的高效节能技
基于视频的运动分析是对包含有各种运动目标的视频图像序列进行分析处理,从场景中检测、跟踪、分类识别目标。所有这些技术的实现是以背景建模为基础的,因此,对于视频背景建模的
三维人脸重建在人脸识别、影视制作、网络游戏以及医学等方面中的应用越来越广泛,并且随着计算机技术的快速发展,三维人脸重建已经成为当今计算机图形学、计算机视觉以及模式识
DNA链置换技术是一种在DNA自组装技术的基础上发展起来的动态DNA纳米技术。DNA链置换技术可实现输入信号与输出信号之间的动态连接,是构建逻辑门及逻辑电路的一种新方法。根