基于语义的跨媒体搜索

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:tuoba888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、互联网和多媒体技术的迅速发展,快速地搜索及有效地管理海量的多媒体已成为目前迫切需要解决的问题,并且成为近年来的研究内容热点。本文分别从基于文本语义的跨媒体搜索和视频中文字的检测识别和视频来源识别这三个方面就基于内容的视频搜索进行研究,提出一些新的算法和框架。1、在基于语义的跨媒体视频搜索方面,提出一种依据查询内容,对来自于不同媒体的索引分别进行搜索的视频检索框架,系统框架分为基于文本语义的视频搜索和基于图像音频等媒体语义的视频搜索两个部分。实现了文本分析预处理、文本和视频内容的概念语义提取,字幕、音频、视频来源等媒体的概念语义检测,并利用lucene完成检索和排序。该系统在TRECVID2012的基于语义的视频搜索任务(KIS)的测试集中进行测试,排名第四名,充分体现了所提出的框架的有效性。2、在语义提取和分析方面,相比于其他对视频中语义概念的检测,视频中的文字对于直接理解视频的内容有重要作用,因为视频中出现的文字,特别是标题和字幕,是一种对视频内容或高层语义十分有效的描述信息,并且其内容比检测其他内容对整个视频的语义描述更具直接性。针对视频中文字的检测和识别,提出并实现了一种视频中静态字幕和滚动字幕的检测方法,提取角点和光流等视觉特征,训练支持向量机(Support Vector Machine, SVM)作为分类器,将视频中的文字和字幕检测并提取出来,经过后处理,并借助光学字符识别(Optical Character Recognition, OCR)软件识别。该算法在数据集中进行测试,证明了其有效性。3、在语义提取和分析方面,在现有的主要针对场景、物体等视频或者图片内容的概念语义检测器之外,提出并实现了一种对视频来源出处的检测,重点是对视频来源标识——台标的识别算法。采用两级级联检索策略,使用边缘模板、RGB空间颜色直方图、方向梯度直方图、改进的γ-LBP作为视觉特征,逐级采用最近邻搜索的方法计算图像台标区域与模板的相似度。在自建的数据集上进行测试,证明了这种算法的有效性。这种对视频来源出处的检测,可以有效限定并减少搜索的范围,直接影响着视频搜索的效率。
其他文献
目的:胰岛移植目前被视为1型糖尿病患者可能的治愈方案之一,目前基于埃德蒙顿方案的临床胰岛移植方案取得了很大成功,使众多1型糖尿病患者脱离了对外源性胰岛素的依赖,但是大部分
在我国社会经济不断发展的过程中,无论是经济市场的环境还是社会形势都在不断变化,众所周知,在经济市场运行发展过程中存在有诸多不确定因素,各行各业的企业想要长久健康的发
随着无线通信系统的快速发展,射频微波电路的设计变得越来越重要。为了寻求一种能够准确的描述射频微波电路非线性的方法,以便达到提高设计效率和缩短设计周期的目的。因此,对于
随着人们生活水平的不断提高,对电力资源的需求量也在不断的加大.电力自动化作为电力系统的重要组成部分,其不仅影响着人们的生活用电质量,而且还在一定程度上关系着国家电网
该文采用人工神经网络构成专家系统的主体框架,开发出了具有较强功能和较高效率的人工神经网络专家系统,对训练样本进行迭代学习之后,能够高速地完成目标识别与分类.在对神经
樱属(Cerasus)植物钟花樱(Cerasus cerasoides(D.Don)var. campanulata(Koidz)X.R.Wang et Shang )因其具有极高的可观赏性,深受人们的喜爱,但对其研究利用却很少,为开发利用
学位
文章先分析了项目法律合规的风险控制实施,包括组织架构、管控重点和管理流程,随后提出了项目法律合规实现精细化控制的措施,包括法律文书管理、创建风险数据库、提高风险识
学位
作为我国经济发展的内在推动力,随着我国经济建设的不断加快,企业正面临着前所未有的挑战.于企业,人才是决定企业兴衰的关键.没有优秀的人才,就意味着企业没有竞争实力.因此,