图像语义自动标注的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:chanck5800
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,图片获取和传播途径的日益宽广以及图片存储能力的不断提高,使得海量图像数据库成为人们获取和检索图像的主要对象。如何从这些海量图像数据中获取具有特定语义的图像成为人们的研究热点之一。   图像检索也是计算机视觉和模式识别领域中一个重要的研究方向。早期,图像检索主要是基于文本的,需要手工对图片进行标注,然而海量图像数据库的出现,使得手工标注图像存在工作量庞大、标注的主观二义性等问题。于是,基于内容的图像检索方式被提出,并得到了广泛关注,这种检索方式主要是通过提取图像的低层特征来计算图像之间的特征相似性,最终找到相似的图像。这种方式简单直接,但是存在“语义鸿沟”问题,即相同或相似的低层特征所表达的高层语义内容往往是完全不同的。为了解决这个问题,人们提出了基于语义的自动图像标注,用于支持图像检索。基于语义的图像标注首先要建立图像低层特征和语义概念之间的对应关系模型,标注时可以利用该关系模型来计算最适合待标注图像的语义概念。   本文对图像语义自动标注相关技术进行了深入的研究,主要工作和创新点如下:   (1)为了减小“语义鸿沟”对图像检索的影响,提出基于潜在语义概率分析和高斯混合模型的图像自动标注方法,并结合了训练集中语义概念之间的语义相关性,对测试集中的图像进行自动的语义标注。首先用潜在语义概率分析技术在训练集的文本空间中拟合出主题集合,然后根据图像的低层视觉特征建立每个主题对应的高斯混合模型,准确描述每个主题的语义内容,进而减小了“语义鸿沟”。该方法有效的结合了连续的、去除背景噪声的低层视觉特征和语义概念的语义相关性,建立较少的高斯混合模型,提高了标注的性能。   (2)针对图像语义自动标注中语义概念之间的关联性,提出语义相关的自动图像标注方法。对于每个由图像区域特征组成的正包,用高斯混合模型拟合其对应的概率密度。由于高斯混合模型的标注过程忽略了语义关联性,所以结合语义概念的语义关联性,用视觉特征和文本特征来优化高斯混合模型预测的后验概率,减小了“语义鸿沟”的影响,提高自动标注准确率。   (3)结合形状上下文及尺度不变特征变换技术,提出一种有效的轮廓描述方法用于轮廓图像的标注和识别。首先用轮廓边缘上的所有采样特征点的位置关系表征边缘上的一个采样点的特征,然后用聚类和向量化技术将轮廓图像的形状表示为词袋模型,形成轮廓图像的特征向量。最后基于这个特征,开发一个简单的轮廓图像识别系统,验证了这种特征的有效性。
其他文献
在信息技术的快速发展下,越来越多的数据库(例如参数规范,统计和生命科学数据)通过互联网发布。侵犯版权已经成为网络系统和电子商业中最具破坏性的威胁之一。此外,在线分发的数据
随着计算机技术和网络技术的不断发展和广泛应用,网络教育问题备受重视,基于网络的学习方式获得了迅速的发展,一种新的教学系统——智能化网络教学系统正在蓬勃兴起。现有的教学
互联网领域技术高速发展,产生了大量的网络数据,用户迫切需要以较快较准确的方法获取文本的核心信息,而搜索引擎给出的信息依然过多、过滥,用户很难通过搜索引擎快速准确地定位到
面对庞大的视觉信息,由于处理能力有限,人类视觉系统能自动有选择地处理复杂自然场景中的重要视觉信息,这种优先处理重要信息的能力,也称为视觉选择注意机制,让人类能够快速、准确
语音情感识别是情感研究领域的研究热点之一,其通过获取说话人的语音情感特征参数,进而识别说话人的情感状态。语音情感识别在测谎、心理学研究和智能人机交互等领域都有广泛的
人脸识别是图像处理和模式识别领域的一个重要研究课题,人脸识别和认证技术在公共安全、智能监控、多媒体等领域有着广阔的应用前景。经过数十年的研究,在理想情况下人脸识别技
作为非侵入方式,对人体或人体某部分进行诊断的医学影像正随着三维重建及其交互技术的发展而受到越来越多医生和科研工作者的关注。具有解毒、排泄、免疫、内分泌代谢等功能的
基于视觉的道路检测的关键是如何将像素点准确归为道路表面和非道路表面,这在阴影、车流量较大且路面情况复杂等情况下存在很大挑战,而单目视觉具有成本低廉、处理难度较大的特
随着网络日益普及和使用电子商务平台进行购物的用户越来越多,电商的商品种类和信息也越来越庞大,海量的商品和平台信息往往消耗掉网购用户大量的时间和精力进行查找商品或检索
为了便于人眼视觉观察和后续计算机分析处理,图像复原和图像增强能够突出图像中的部分细节信息。由于存在大气粒子的作用,雨雾天气时,空气中充满着小水珠,各种图像实物的反射