自然场景图像的自动标注方法研究

来源 :山东大学 | 被引量 : 1次 | 上传用户:lipurple
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的迅速发展,数字多媒体图像出现了飞跃式的增长,海量的图像资源给人类带来了便利同时也带来了挑战,比如,如何准确、高效地从大量图像数据库中检索出所需资源己成为一大难题。但因“语义鸿沟”的出现,使得低维的图像特征不能表达用户丰富语义,这给基于内容的图像检索以及图像标注的发展带来很大限制,同时为了解决人工标注带来的困难,图像自动标注技术应运而生,成为当前关键的研究课题。图像自动标注的过程是,计算机首先训练已标注的图像,自动学习低层视觉特征与高层图像语义间的关系模型,然后将模型运用到未知语义的图像中,实现自动标注图像任务。本文从数据挖掘中的关联规则出发,提出一种基于模糊关联规则和决策树的图像自动标注模型。模糊关联规则是数据挖掘和分类领域的重要方法,能解决分类的模糊性、不准确性。本文将模糊关联规则运用到图像标注领域,提高了标注的准确性。此外,针对海量的图像数据库形成的大量冗余关联规则,该方法做出了算法的改善,提高算法的效率。文中再围绕“二次标注”的思想,在模糊关联规则和决策树的图像自动标注模型上,通过计算标注词的“语义相似性”,删除无关标注词,大大提高了标注的性能。本文取得的主要成果有:1.方法引入隶属度函数,首先将数值型图像低维视觉特征转化为语义模糊特征,得到模糊特征向量,再建立模糊特征和图像高层语义的联系的模糊关联规则,最后基于决策树方法剪枝策略删减关联度低的模糊关联规则。方法一方面跨越了语义鸿沟问题,另一方面大大减小了标注的时间复杂度。实验使用Corel5k和IAPR-TC12图像数据集来测试标注的性能,引入了标注精度、召回率、F-measure以及规则数目几个衡量标准,通过与其他标注模型的对比,验证该方法标注的准确性和优越性。2.在模糊关联规则和决策树的图像自动标注模型的基础上,本文使用语义相似性度量思想,通过“语义去噪”过程,实现对待标注模型的优化,提出一种加权语义相似度度量方法。用加权的方式计算单词对的距离和单词对的深度,达到删除语义相似度低的标注词汇的目的,改进语义标注的性能。
其他文献
呼叫中心是企业通过现代通信技术和计算机技术为用户提供服务的一种沟通渠道。随着企业呼叫中心对多种通信方式融合的需求越来越强烈,统一通信技术正在不断发展并被广泛应用
在虚拟场景漫游时,观察者走到每一点都需要尽可能快得确定哪些对象是可见的,因此设计合适的可见性计算方法不仅能实现快速绘制,还能节省存储空间和内存空间。二维情况下,就是
SNP(Single Nucleotide Polymorphism)分析在探究生物群体的遗传关系、分析疾病关联性等方面发挥着重要的作用,但与单个SNP相比,单体型数据包含了更加丰富的遗传信息,其在基
安全协议通常描述了公共网络中两个或多个智能进程之间的消息交换行为,从而保证对交互过程中诸如认证、机密保持、密钥一致、隐私和匿名性等安全属性的支持。但是,设计一个安
由于网络技术的不断发展,web服务、电子商务的广泛应用,XML已成为网络应用中数据表示和数据交换的标准。XML表示数据的同时,还携带了数据的语义,可以作为一种中间格式,为所有
基于口令认证的群组密钥协商协议(Password-Authenticated Group Key Exchange Protocol, PAGKE协议)允许群组用户在一个公共网络上使用低熵的容易记忆的口令协商出一个高熵
智能系统是能够理解、学习复杂信息并能做出决策和分析行为的软硬件实体,具备识别对象和事件、存储丰富的可利用知识、推理和预测等基本能力,能够适应复杂环境并能够从环境中获
学位
指纹因其唯一性、可靠性和方便性已经发展成为了主流的生物特征识别手段。指纹识别广泛应用于日常考勤、身份鉴别、数据加密、电子商务、电子政务等系统,为人们的日常生活提
推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤,应用知识发现技术来生成个性化推荐。协同过滤是一种常用的减少信息过载的技术,已经成为了个性化推荐系统的一种主
随着信息技术的发展,尤其是数据获取技术和数据存储技术的发展,人们几乎可以随时随地获取数量巨大的数据,并存储下来。然而,数据本身的价值有限,如果没有一种有效的工具帮助