基于时空融合的多媒体事件检测

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:yangglan2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体事件检测(Multimedia event detection, MED)是计算机视觉和视频检索领域中一个极具挑战性的研究热点。过去的十年,人工设计(Hand-crafted)的特征及其融合策略在诸如UCF-101等公开的行为库中获得了较高的识别精度,却未能在MED中取得令人满意的结果。这是由于多媒体事件远比行为识别任务复杂,其视频内容抽象多变,难以用传统的底层特征表示。最近几年,深度学习在图像分类领域不断取得突破,它借助大数据集下规模化的监督学习,提取出有效的图像表示;特别是其端到端的学习模式为其他一些视觉任务提供了有益参考。然而,在MED等特定的视频任务中,深度学习算法由于缺乏成熟的面向视频分析的网络结构以及受到设备的限制,依然没能取得较大进步。本文针对MED任务中的难点,从特征的提取、视频内容的表示、分类器学习等方面进行了深入的研究,主要工作包括:1.提出了一种融合多个深度网络模型的图像特征提取算法,提高了特征的区分性和泛化能力。2.基于经典VLAD编码方法,提出了一种改进的视频表示算法,增强了视频表示的有效性。3.提出了一种基于线性支持向量机的视频分类算法,实现了视频的快速分类。4.搭建了一个基于时空融合的多媒体事件检测系统,在TRECVID2016MED评测中的10EX和100EX任务中均获得了第一名,同时在其他多个数据集和全国首届舆情挑战赛上也取得了好成绩,验证了本文提出的MED检测框架及算法的有效性。
其他文献
<正>腹部手术中的隔离技术是指手术中将腹内一个或几个器官、腹膜腔的一部分甚至全部隔离开来,从而减少术区污染和肿瘤播散、改善术野显露、避免副损伤以及降低手
本文笔者通过一篇教学设计向我们展示了一堂生动、活泼,而又具有良好教学效果的英文课,正如她的设计思路所讲:将课内的学习延伸到课外,维持学生的学习兴趣,不但掌握了所学知
本文根据宁夏的新能源装机及出力现状,阐述了西北及宁夏新能源消纳所面临的问题,分析了跨区直流输电对促进宁夏新能源消纳的重要性,分析了现有日前计划编制流程中跨区直流外
抗战时期,国民政府为取得胜利开展了较为广泛的动员工作。本文选取湖北省第六行政督察区为研究家对象,从抗战动员宣传、人力动员、经济动员三个方面讨论抗战动员在这一地区的
目的:研究十六层螺旋CT测定冠状动脉钙化积分的信度及其重建冠状动脉的最佳时相,并了解冠状动脉钙化积分与糖尿病、高血压、高血脂等因素的关系,初步确定冠状动脉钙化积分诊
目的:探讨血小板/淋巴细胞比值(platelet/lymphocyte ratio,PLR)、中性粒细胞/淋巴细胞比值(neutrophil/lymphocyte ratio,NLR)与维持性血液透析(maintenance hemodialysis,MHD)患者蛋白质能量消耗(protein energy wasting,PEW)的关系。方法:采用多中心横断面研究,收集2017年6至8月于贵州省
近些年来,随着我国一系列发展战略的提出和深入践行,我国的国民经济水平和居民消费需求大幅提高,由此带来更为广阔的大众文化消费市场。与此同时,“全民阅读”使得图书再次受到大众的关注,重新激起一大批读者的阅读兴趣,文化消费规模不断扩大,实体书店重新焕发生机。由于科学技术的发展、进步,全媒体出版及屏阅读的兴盛对传统纸媒造成一定影响,实体书店纷纷转型以应对冲击。本文以此为研究背景,将实体书店的行业领先者中信
从原料、结构方面介绍了非织造过滤材料的优势,并且阐述了其过滤机理、影响因素和测试方法。介绍了多种非织造过滤材料的性能及其在相关行业的应用状况,分析了非织造过滤材料
目的:探讨小儿肾脏疾病与微量元素改变的相关规律。方法:采用原子吸收快速测定法对肾脏病患儿的血、尿微量元素(锌铜铁镁)含量及铜/锌比值进行观察,并将肾病综合征患儿的血锌
随着社会变迁不断加速,个体的社会地位和生活情境都处于变化与流动中。人们在适应新地位与新角色的过程中,往往会出现社会边缘化现象。社会边缘化是社会适应的过程与结果,是