视频语义特征提取算法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:altertig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体技术的发展产生了大量的多媒体数据,多媒体压缩技术和迅速扩张的互联网便利了多媒体数据的存储及传输。多媒体数据形式多样,包括文本、图像、音频和视频等。随着多媒体数据量的急剧增加,传统的基于文本的多媒体信息检索越来越不能满足应用的需要,人们希望计算机能够自动地对多媒体数据的内容进行分析、根据分析结果进行检索,也就是基于内容的多媒体信息检索。 视频是多媒体数据的一个重要组成部分,具有区别于其它多媒体数据的特性。视频的组成复杂,包含有文本、音频和图像等多方面的信息,视频还同时涉及时间域和空间域,由此带来了视频分析的复杂性。面对越来越多的海量视频数据,如何从中找到所需的视频片断(镜头或场景)成为一个日趋迫切的问题。因此,基于内容的视频检索获得了越来越多的关注。 视频语义特征提取是基于内容的视频检索中的一个关键环节。视频语义特征提取的任务就是将底层物理特征映射到视频语义特征,实现对视频的自动语义标注。视频具有时空特性,图像帧从空间域描述了视频内容,视频运动则从时间域描述了视频内容。目前,相关的视频语义特征提取的工作主要集中于TRECVID,IBM和CMU等研究机构在此评测中取得了较好的成绩。但是,底层物理特征和视频语义特征之间仍然存在着“语义鸿沟”,视频语义特征的提取方法仍然不够成熟,需要进一步的研究和探讨。 本文就视频语义特征提取中的两方面问题,视频运动分析和高层语义特征提取,分别进行了讨论并提出了新的相关算法。 视频运动分析是将光流场(0FF)或运动向量场(MVF)的特征映射到具体的运动类型。运动类型是从时间域描述视频内容,反映视频语义。传统的视频运动分析假设物体运动或者是相机运动主导了视频运动,在分析此种假设不合理的基础之上,我们阐述了判断视频运动起因的必要性和可能性,提出了新的视频运动分析框架,并给出了一种利用运动向量相互关系判断运动起因的算法。 高层语义特征提取是将底层物理特征映射到高层语义特征。视频局部高层语义特征,即物体特征,描述的是图像帧中的物体,是图像帧的一个局部。考虑到物体本身以及物体所处的特定场景所具有的视觉特点,我们提出一种将图像帧的局部信息和全局信息结合起来提取视频局部高层语义特征的算法。 针对所提出的两种算法,我们在TRECVID2005的数据集上分别进行了实验,实验结果表明了算法的有效性。
其他文献
重庆火锅开遍了大江南北,却只有本地老店的滋味儿最为地道、正宗。影视、新闻和都市三大地面频道三足鼎立,为重庆广电的地缘优势打下了坚实的基础。 Chongqing hot pot open
目的 分析在输卵管梗阻性不孕症患者的临床治疗中,应用输卵管介入术联合中药综合治疗的临床应用效果.方法 选取我院于2018年12月至2019年12月收治的420例输卵管梗阻性不孕症
以风能、太阳能等为代表性的分布式发电单元受到气候和天气影响,发电功率难以保证平稳,可能会引起频率和电压不稳,进而引起停电事故。为了解决这一问题,在具有分布式电源的系统中引入了储能装置。但是受环境影响,系统供电与用电负荷会出现不平衡的情况,从而导致蓄电池处于亏电状态或过充电状态,长期运行会降低蓄电池组的使用寿命,增加系统维护成本,因此选择合适的蓄电池控制策略具有重要的实际意义。本文研究了一个由分布式
目的 观察中医辨证治疗糖尿病性胃轻瘫的临床疗效.方法 患者均为2016年4月至2018年6月来我院治疗的糖尿病伴有胃轻瘫94例,按照就诊先后顺序随机分为对照组和治疗组,各47例,患
分析了普适环境下协同设计存在的相关问题,尤其是手持设备等移动终端的感知局限,资源不均衡站点之间交互感知带来的负面影响。利用环境上下文、设备上下文、用户上下文提高计算
自动身份鉴定作为安全系统的重要组成部分面临着许多挑战和实际的应用。而生物识别技术因其独特的优势而获得了迅速的发展。掌纹识别技术作为一种相对较新的生物识别技术,也有
世界经济全球化对企业的生存环境产生了深刻的影响,企业面临着新的全球化的市场竞争环境,这对企业的工作流的应用提出了更高的要求,同时也促进了工作流领域研究工作的开展。
随着无线通信、微电子、传感器等技术的发展,传感器节点越来越微型化、智能化,无线传感器网络比现有网络技术易于部署,且能够适应恶劣环境,已广泛应用于军事、工业、民用、环境监
目的 探讨中西医结合治疗急性肺炎18例的临床疗效.方法 随机选取2019年3月至2020年3月某院综合内科收治的急性肺炎患者参与研究调查,并抽取其中的37例分为参照组(19例)和研究