基于内容的多媒体信息检索关键技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:TRACY101688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的多媒体信息检索是当今多媒体分析和处理领域的一个重要研究方向。它通过计算用户提交的查询实例与数据库中实例的内容相似度,对数据库中的实例进行自动排序,从而使用户能快速查找出感兴趣的信息。传统的多媒体信息检索技术主要以文本关键词为基础,利用图像和音视频数据的文本标注信息来进行查询检索。这种以文本为主的检索模式有明显的不足:首先,由于”语义鸿沟”的存在,无法在文本关键词的高层语义和媒体信息处理中提取的底层特征之间建立有效关联,使得这种检索模式对多媒体内容的分析与理解存在歧义性。其次,在大规模多媒体数据库中,多媒体信息的文本标注信息的获取需要耗费大量的人力和时间。因此,基于多媒体内容的信息检索技术得到了广泛的关注和研究。   本文对基于内容的多媒体信息检索技术进行了深入分析,研究并探索了当前存在的若干难点问题:详细研究了多媒体信息的特征描述,对图像特征构建了鲁棒的特征子空间模型,同时设计了基于音视频特征的词袋模型检索框架并对音视频两种信息尝试了融合;创建了一致性词表结构实现多音频特征的有效融合和快速索引;提出新颖的视觉语义概念检测模块并实现了文本信息与视觉信息的语义关联;探索了基于多源信息的排序模型的目标函数学习等等。本文的主要工作和贡献如下:   ·针对目前图像特征描述和数据建模存在的问题,结合传统的稀疏编码理论,提出了一种基于关键编码学习(Key-coding Learning)的地形学子空间模型(Topographic Subspace Model),可以有效地对图像进行具有判别力的稀疏描述。关键编码学习根据样本的标记分布被归为归纳迁移式学习方法,使用海量未标记辅助样本来解决机器学习中有标记训练样本不足的问题,辅助样本与训练样本不需要满足独立同分布条件;通过对未标记辅助样本构建地形学子空间模型,有效地对样本数据的分布进行准确建模:在地形学子空间中,对每幅图像提取的大量局部特征描述子进行关键编码学习,最终对每幅图像生成一组任意维的稀疏特征向量,这组稀疏特征向量兼具了计算快速和判别力强的优点。   ·为了加强音视频特征描述和提高检索效率,本文提出了一个基于词袋模型的音视频检索框架。区别于传统的词袋模型,对视觉信息的检索构建了基于语义的视觉概念词袋模型(Bag-of-visual-concept-words Model)。该模型通过检测视频镜头中的视觉语义概念,对视频在时间序列上按照镜头构建视频语义关键词的词袋模型,有效地克服了传统词袋模型的”语义鸿沟”问题;在音频信息检索中本文提出了基于音   频关键词的词袋模型(Bag-of-audio-words Model),并基于多个音频特征提出了一致性词表(Coherency Vocabulary)索引结构,有效地对多种音频特征进行融合并实现快速检索。在词袋模型的框架下,不同的后融合策略被用来实现视频和音频信息的融合   ·通过基于内容的多媒体信息检索技术,本文设计并实现了一个基于网络视频的问答系统,通过网络视频来回答用户提出的文本问题。该系统集成了多个新颖模块,包括基于AdaBoost和Z-grid训练算法的视觉概念检测模块、多模态的复制视频检测(Video Copy Detection)模块、基于多源信息和Gradient Boosting的排序模块等。另外,为了方便用户快速友好地浏览视频答案,我们还设计了两种友好的用户界面。
其他文献
随着人类经济发展的需要,陆地石油开采已不能完全满足社会生产需求。从上世纪五六十年代开始,人们将视野逐渐转向了海洋油气开采。但是海洋油气开采具有作业环境恶劣、开发困
随着机器视觉理论的发展,双目立体视觉技术在工业发展中发挥了越来越重要的作用,具有广泛的应用性。移动机器人导航技术是移动机器人研究领域中的一项关键技术,涉及到机器人的感
为了应对能源危机与环境问题,维持人类社会的可持续发展,可再生能源开始受到人们的重视。太阳能因具有储量丰富、分布广泛、使用清洁无污染等特点,成为人们关注的焦点。其中,
压气机在当前社会生产生活中起着越来越大的重要作用,而其稳定运行则是该作用得到保证的关键。为了更好的控制压气机的稳定运行,必须更好的了解压气机的工作特性。在该问题上
交通作为城市经济活动的命脉,对城市的经济发展、人民的生活水平提高起着至关重要的作用。目前,北京的机动车数量迅猛增长,而道路增长速度和车辆的增长速度严重脱节,这是造成
随着生产实践和科学研究的深入,人类面临的优化问题也越来越复杂,传统优化方法已不能在有限开销内找到满意解,所以需要不断的找出更好更快的优化算法来解决问题。粒子群算法(
随着计算机视觉技术与机器人技术的蓬勃发展,服务机器人逐渐走进人们的生活当中。作为实现机器人与人类交互的关键性技术,行人跟随技术受到越来越多研究者的关注。目前在行人目
试井是油藏工程的重要手段,而其核心是压力试井,因此地层压力测量是石油试井技术中必不可少的工作。目前国内油田多使用电子压力计来实现压力数据的采集、存储和数据浏览的功能
作为一种非侵入式的交互接口,基于视觉的动态手势识别可以实现自然、方便的人与机器人交互(Human-robot Interaction,HRI),简称人机交互。近年来,随着一次学习(One-shot Learning
水下机器人是一种很重要的水下探测调查器,利用水下机器人可在海洋深处直接进行海洋生物、物理、化学和地质等科学考察活动,可以在深海勘测地形、地貌、采集海底样品,支持海洋工