基于内容的多媒体图像检索模型的研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:o9876521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着网络技术的飞速发展以及移动数码设备的普及,网络多媒体内容呈现爆炸式的增长已经成为一种趋势。各式各样的多媒体内容无论在存储、传输以及分析的过程中,无不给现在的检索技术提出了挑战。人们在面多纷繁复杂,眼花缭乱的多媒体信息选择时,缺少有效的检索工具将会是一件十分头疼的事。基于文本关键字的传统检索模型已经逐渐跟不上人们对多媒体检索的需求,正是在种情况下,人们提出了基于内容的多媒体检索模型的研究,对人类在信息检索领域的发展有十分重要的意义。基于内容的多媒体检索(MULTIMEDIA RETRIEVAL BASED ON CONTENT)就是根据多媒体内容的本身语义进行检索,这与基于文本的检索有着本质的区别。本文首先对多媒体数据和各种检索模型作了一个简单的回顾,总结了图像检索模型、视频检索模型、音频检索模型等的发展概况。同时也详细介绍了基于内容的多媒体图像检索模型,并针对该种检索模型的关键技术展开了论述。如,图像特征提取、图像索引技术、相关反馈算法等。接着,从图像提取特征方面出发,讨论了基于SIFT图像不变特征提取算法,对SIFT特征向量的生成和匹配过程进行了深入讨论和分析,总结其在图像特征提取方面的优势与不足。最后针对SIFT提取过程中的不足,如尺度空间构造耗时、计算机复杂度较高等方面提出了一些改进。本文主要通过尺度空间构造过程的优化和特征向量的降维对SIFT算法进行了改进,并利用改进型SIFT算法进行图像检索模型的实验,并取得了较好的结果。本文的主要贡献在于:1)分析了各种主流图像特征提取方法的优劣,并针对SIFT的不足,并提出了部分改进方法;2)提出了一种基于改进型SIFT的图像检索模型,该算法采用高斯核尺寸自适应的方法来构建金字塔影像,降低其计算复杂度,然后按照传统步骤进行提取特征,以欧式距离来度量相似性,最后运用BBF搜索算法来进行图像检索。本文的初步实验结果表明,该图像检索模型能够检测出经过平移、尺度、仿射、光照等变化下的目标图像,以及对具有特定特征的图像检索,无论在时间还是效率上都具有相当的优越性。
其他文献
无线网络相对于有线网络在很多资源和性能方面受到约束,例如:有电池供应电量的节点能量有限,节点的存储容量和计算能力受到制约,通信能力相对下降等。无线网络链路的物理层广
粒子群优化算法(Particle Swarm Optimization, PSO)是一种新颖进化计算方法,最初受启发于鸟群和鱼群特定的社会行为,是基于种群搜索策略的自适应随机优化算法。粒子群优化算
传统的勤工助学工作流程主要是以传统的纯手工和纸质操作为主,在很多情况下都是直接使用VFP、Excel等软件对整个数据流程进行单机操作,基本上没有专业的勤工助学管理软件。这
图像分割是计算机视觉研究的核心问题,其通过将图像划分成互不相交的区域,根据不同区域表现出明显的差异,从而提取出用户感兴趣的目标对象,广泛应用于工业、医疗、军事等领域
众所周知,智能体或称为Agent可以通过相互协作来实现他们的共同目标,以提高其整体的性能。在多Agent系统中,这种相互协作通常采用Agent联盟的形式来完成。所谓联盟就是多个同意
小水电作为清洁的可再生能源,是国家能源发展的重点战略方向。但是目前大多数的水电站对水电机组的异常噪声和故障诊断主要采用人工判断方式,不仅速度慢而且还会影响判断的准确性,因此需要研究基于机器学习的识别方法。流形学习具有探索数据集内在规律的能力,如何将流形学习算法应用于水电机组噪声源识别中具有研究价值。本文分析了水电机组噪声信号的特点以及流形学习方法应用在水电机组噪声源识别上所面临的问题,设计了针对性
文本分类是指在给定的分类体系下,根据文本的内容自动识别文本类别的过程。它是文本挖掘的基础与核心。从国内外该课题的研究分析可知,对于中文文本分类而言,分词问题和短文本分
互联网的逐渐发展,网络规模的不断扩大,网络技术持续的推层出新,各式各样网络应用迅速地出现与融入到人们的平常生活与工作当中,并保持着越来越社会化的趋势而不断发展壮大。这一
随着实时系统的不断发展,各式新应用的涌现,实时系统灵活性的要求越来越高。而实时调度算法承载着实时系统性能优劣的关键,一直以来是实时系统领域研究的重点。为了应对这些
射频识别(Radio Frequency Identification, RFID),是一种具有广泛的应用前景非接触的自动识别技术。在RFID应用系统中,RFID中间件是其中重要的组成部分,其作为将RFID读写器