【摘 要】
:
视频场景分割是基于内容的视频检索的重要环节,它将镜头作为研究对象,根据镜头内容的相关性把相似的镜头划分到同一个场景中,这样就可以将一段完整的视频划分成多个逻辑故事单元。目前的视频场景分割方法采用图像特征作为视频的底层特征,并没有全面考虑视频镜头所包含的信息,从而导致场景分割的准确率不高。该文在充分分析视频内容结构和深入研究视频场景分割方法的基础上,提出了一种基于支持向量机的多模态视频场景分割算法,
论文部分内容阅读
视频场景分割是基于内容的视频检索的重要环节,它将镜头作为研究对象,根据镜头内容的相关性把相似的镜头划分到同一个场景中,这样就可以将一段完整的视频划分成多个逻辑故事单元。目前的视频场景分割方法采用图像特征作为视频的底层特征,并没有全面考虑视频镜头所包含的信息,从而导致场景分割的准确率不高。该文在充分分析视频内容结构和深入研究视频场景分割方法的基础上,提出了一种基于支持向量机的多模态视频场景分割算法,通过在多种视频上的实验验证了该算法具有较高的检索效果,能够实现对不同视频序列的快速而准确地分割,提高在海量视频中寻找特定视频片段的准确度并降低查找的时间成本。该文主要研究内容如下:(1)视频数据预处理。该文针对目前采用图像特征来代表视频底层特征而导致镜头部分内容丢失的问题,通过多模态融合思想对视频底层特征进行提取,在已经提取图像特征的基础上,提取美尔频域倒谱系数来代表音频特征,采用基于统计的特征提取方法,选取词频和反文档频率描述视频的文本特征,并将提取的三类数据用SimFusion算法进行融合,作为视频底层的多模态特征。(2)语义概念检测。该文通过机器学习中支持向量机的分类思想来构建语义提取模型,选用高斯核函数来求解不同类型数据间的最优分类面,并利LIBSVM软件包构造出若干语义分类器,分类出镜头关键帧对应的语义概念,统计数据集中每一类语义概念所返回的相关镜头数,通过评价指标来量化语义分类效果。(3)视频场景分割。在基于语义概念的视频场景分割中,该文采用语义重叠镜头链算法划分出不同的场景,由实验结果及分析可知,由于充分考虑了多模态之间的内在特性,与文献[35]相比,该文不仅在语义概念检测中取得了较好的效果,而且在多种视频数据的场景分割上都取得了更高的查全率与查准率。多种视频数据的实验结果表明,该文算法的查全率、查准率达到了91.18%与92.81%,相较于文献[35]提高了2.36%与1.29%,综合指标达到了92.45%,相较于文献[35]提高了1.84%。
其他文献
我国是第一渔业大国,不论是捕捞量还是养殖量在世界上的排名都很靠前。然而我国对于鱼类的加工却相对落后,技术和装备的水平平均较低,许多地方还是采用纯手工加工方式作业。特别是鱼类前处理加工环节,而前处理环节直接影响到整个渔业现代化技术的发展。切头去尾环节是鱼类前处理环节中比较重要的一个环节,将鱼头和鱼尾与鱼肉主体部分进行有效分离,不但增加了鱼肉的利用率,提高渔业利润,还方便了后续的加工或者运输,大大提高
碾米机是稻米加工工艺中的核心设备,其碾米性能直接关乎到所加工精米的产品质量。按碾白辊布置形式不同,碾米机主要分为:卧式碾米机和立式碾米机。其中,卧式喷风碾米机仍是工业中应用的主流。现有碾米机存在一个问题,卧式碾米机常采用下吸风方式对米糠进行回收,但由于在碾白过程中会产生碎米,部分较小的碎米与米糠一起从碾白室排出,并一同被下部的集糠斗收集。而碎米与米糠具有不同的营养价值,生产中需将两者分离以获得最大
粮食安全储藏是影响国计民生与社会稳定的重要因素,是国家“粮安工程”的基石。只有不断的完善储粮技术,才能确保粮食安全储粮落到实处。当今,在粮食储藏技术方面仍存在诸多问题:第一,相比粮油加工装备发展水平,粮食储藏技术与装备水平较为落后;第二,储粮粮情检测停留在10多年前水平,信息反馈性能差,容易错过最佳粮情处理时机;第三,仓储作业自动化水平低,劳动强度大。因此,基于机器人技术开展对粮仓作业的自动化及智
目的了解武汉地区维持性血液透析患者的血管通路使用情况;探讨影响武汉地区维持性血液透析患者血管通路使用的因素;分析近4年武汉地区维持性血液透析患者血管通路的使用变化及探讨引起这些变化的原因;完善武汉地区维持性血液透析患者血管通路临床资料,为临床研究提供参考依据。方法通过文献回顾筛选影响维持性血液透析患者血管通路使用的变量,依据文献回顾结果制定本次研究资料收集的条目。经武汉市血液透析质量控制中心同意,
随着Web应用的发展,越来越多的人喜欢在网页上上网,因为相比较使用APP来说使用网页上网更方便,不需要下载更多的软件,节约了手机的内存空间。但是Web应用在给人们带来便利的同时也带来了很多威胁,因为网页中的代码都是暴露在页面中的,所以攻击者就会分析其代码逻辑并进行攻击,这会对Web应用的安全问题造成很大的影响。因此,对网页中核心代码的保护显得尤为重要,目前对于Web攻击的一些防护方式要么是牺牲性能
自然语言处理技术作为人工智能领域四大核心技术之一得到了前所未有的发展与应用,其子领域情感分析引起了广大科研爱好者的研究。与此同时,深度学习的发展在自然语言处理诞生了很多诸如BERT的可用于情感分析的模型。本文用BERT结合BiLSTM模型在对抗训练的方式下对Kaggle竞赛平台的新冠肺炎评论数据进行情感分析研究。具体的研究工作如下:(1)对BERT输出特征向量做了改进。由于BERT模型是由12层结
超宽带定位技术,以其优越的定位性能,目前已成为无线定位领域最具发展潜力的定位技术之一。在当今是应用最广泛的无线定位技术。超宽带定位技术具有低功耗、高多径分辨率和定位精度高等特点,在军事、民用等多方面有广泛的应用前景。目前,国内外关于桥梁吊装的现状,大多是在传统吊装工艺的基础上,实施施工技术。但传统吊装定位精度低,无法满足高精度工程施工要求。本文通过查阅大量超宽带定位技术相关文档,研究了近些年国内外
近年来,随着纳米技术的快速发展,基于各种新型材料构建高性能生物传感器成为分析化学、食品安全、环境监测以及临床诊断方面的研究热点。金属有机骨架(MOFs)是由无机金属中心(金属离子或金属簇)与桥连的有机配体通过自组装相互连接,形成的一类具有周期性网络结构的晶态多孔材料,兼有无机材料的刚性和有机材料的柔性特征。MOFs由于具有独特的结构和理化特性,可作为高效纳米酶、荧光猝灭剂、电化学信号媒介体以及酶固
α-淀粉酶是食品加工中的常用酶,催化完成后残留对终产品的稳定性存在一定影响,需要钝化酶。热力灭酶技术是目前工业最常用手段,但食品受强热后,会发生物理或化学性质的变化,造成其色、香、味、组织结构的劣变以及营养品质的下降。高压脉冲电场作为一项新兴的食品加工技术,在高效灭酶的同时能保存食品原有品质,然而高压脉冲电场对α-淀粉酶的抑制效果与机理,规律还未有定论,α-淀粉酶在外电场处理过程中空间结构的变化尚
淡水鱼是我国极其重要的一种水产品,其前处理加工方面的技术是影响我国水产品加工业现代化的进程的主要因素之一。去鱼头鱼尾工序是淡水鱼前处理加工的首要环节,利用该工序可实现鱼头鱼尾与鱼体的相互分离,减少鱼体浪费率,同时增加了淡水鱼深加工的效益。本研究结合目前国内主要由人工处理鱼头鱼尾的现状,以鲢鱼为研究对象,利用MATLAB结合图像处理算法,以Faster RCNN目标检测技术为基础实现了鱼头鱼尾的准确