基于内容的视频分析关键技术

被引量 : 8次 | 上传用户:leng36318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和通信技术、宽带网络技术、音视频压缩技术以及计算机硬件技术的发展,数字视频也越来越广泛地融入于人们的生活中。由于视频数据自身内容的丰富性和多样性、结构的复杂性以及具有时空多维结构性,如何有效地对这些视频数据进行组织、表达、存储和管理,以便人们快速地浏览和检索,成为一个亟待解决的重大课题。传统的数据管理与检索技术已远不能适应这种急速的变化和需求,因此基于内容的视频检索(CBVR)应运而生,相关的研究迅速在各研究机构展开。同时,随着网络摄像头的普及以及人们安全意识的提高,对于视频监控以及监控视频的智能分析的需求也越来越迫切。目前,虽然CBVR和监控视频的智能分析在多个方面取得了长足的进步,但是视频中语义对象的提取、检索、视频的智能分析等仍存在较大的问题。本论文围绕基于内容的视频分析与检索中的难点—高层语义提取问题,从底层特征描述、语义对象提取、评估协议、事件检测、医疗设备使用监督等方面进行了研究,提出了一些新的算法和框架,主要贡献如下:在视觉底层特征方面,对大规模数据中视觉底层特征在高层语义提取上的性能进行了全面评估,并提出了ML-SIFT特征提取算法。如何从众多的底层特征中选择出好的特征以更好地描述视频,决定了视频高层语义提取的性能。因此,本章在TRECVID2009大规模数据集上,通过实验对目前在高层语义提取中广泛使用的基于关键点、纹理、边缘、颜色信息的多种类型的视觉底层特征进行了全面的性能评估,其结果对高层语义提取中的特征选择是很有价值的参考。在本章中,我们还针对在高层语义提取中表现最好的关键点特征,提出了一种ML-SIFT算法。在数据集Calatech256和Sceneclass13上的实验表明,ML-SIFT算法是有效地,其性能较SIFT和SURF算法性能要好。在高层语义提取方面,提出了基于最佳选择的混合融合算法和基于不同标注的融合算法。虽然已经有一些不同的决策级融合算法,并取得了不错的成绩,然而,目前有些融合算法性能的提高不是很明显,也有些融合算法仅对部分甚至小部分语义提取的性能有帮助,而对其它语义提取的性能却没有任何帮助。为此提出了基于最佳选择的混合融合算法。通过在TRECVID 2008数据集上实验表明,基于最佳选择的混合融合算法的性能提高率最好,且对所有语义都有一定的促进作用。同时,针对不同标注对算法性能的影响以及不同标注方法的差异,提出了基于不同标注的融合算法。通过在TRECVID2008数据集上实验显示,基于不同标注的融合算法对对象类高层语义非常有效,而且90%以上的对象类语义的性能都能得到提高。在动作识别算法评估协议方面,量化评估了不同评估协议对算法性能的影响。虽然很多动作识别算法被提出,但是对于算法性能的评估却没有统一平台,而更为糟糕的是,研究者对评估协议对算法性能的影响尚认识不足,这对相关技术的发展是不利的。本章以先进的MoSIFT特征和SVM分类器识别方法为基本算法,在广泛使用的公开数据集KTH上,从不同角度考察了评估协议对动作识别算法性能的影响。实验表明,采用不同的n交叉实验方法,算法性能有很大的波动,当采用1交叉实验方法时,波动最大,达到10.5%;当分别采用留一法与n交叉实验方法时,算法性能同样具有较大的波动,其最大波动达到7.926%。对于n交叉实验方法,随着n交叉实验次数的增加,其性能变化逐渐减小,当交叉次数增加到25次以上,算法性能才是稳定的。另外,不同数据集划分方法对算法性能也有较大的影响,因此在进行算法比较时,需要采用相同的数据划分方法;如果必须在不同的数据划分下实验,则留一法交叉实验方法能使其误差较小在大规模数据集中数据不平衡方面,提出了增强等级算法。由于数据不平衡问题在日常生活中普遍存在,且对分类器性能有较大的影响,所以本章在对现有的处理数据不平衡问题的算法分析的基础上,提出了增强等级算法,该算法集采样、过滤和训练为一体,并融入了等级层次结构。在TRECVID数据集上的评测结果表明,该算法在处理数据不平衡问题时,比任意下采样算法和合奏下采样算法的性能要好,当EHS算法的层数增加时,其性能也能够稳定的提高,具有较好的稳定性。对于不同类型的特征,EHS算法同样表现出优越、稳定的性能,具有良好的鲁棒性。当将该算法应用到2010年的TRECVID视频监控竞赛中,在四个事件上取得了第一的成绩。在家庭医疗设备使用的监督方面,讨论了家庭医疗设备使用监督的可行性问题,提出了一套解决方案。对MAUDE数据集中医疗事故的原因和家庭医疗设备使用情况的调查发现,对家庭医疗设备使用进行监督非常必要。通过卡耐基梅隆大学的CASCUHM研究计划,本章对家庭输液泵使用监督的可行性进行了较为深入的研究,从传感器选择、设置,操作协议的制定,到操作动作的识别算法等,提出了一套解决方案,最终达到平均准确率80%左右,初步证明自动化监督家庭医疗设备的使用是可能的,也为认知辅助系统CASCUHM的研制提供了经验。
其他文献
基于石羊河流域1998年、2002年、2006年、2010年NDVI、夜间灯光数据和TM影像提取的土壤信息,以城市地表人工覆被系统为基础,计算流域土地覆被指数(Land-Cover Index,LCI),利
现代电磁学历经三百多年的发展,日臻成熟和完善。天线作为实现无线电应用的关键设备,顺应移动通信、广播、雷达、制导等无线电应用系统在不同阶段的需要而不断发展。今昔对比
摘要本文认为,通过解读中国传统经典文本来梳理传统文化中技与道的关系非常重要而且有着时代紧迫性。现代技术已经成为如此庞大之物笼罩着整个世界,正影响着一切。我们当前的
在有中国特色的社会主义道路的指引下,在邓小平“允许一部分人先富起来”口号的引导下,我国的综合国力不断加强,我国居民生活水平不断提高,但是,在这个背景下,我国居民的贫富
煤矿企业在生产过程中会产生大量污水,为了减少对生态环境的影响,需要煤矿企业积极研究煤矿污水的处理方法,并构建节能环保水循环利用体系。本文首先阐述了煤矿污水处理及污
本文基于人地关系和人居环境科学理论,以辽河入海口城市——盘锦为实证研究对象,探讨百年来盘锦城乡生产、生活空间和生态空间的格局演变。依蛆盘锦城市发展特征,总结其整体城乡
[目的]测定分析芦笋茎不同部位中氨基酸含量,为芦笋营养价值的开发利用提供理论依据。[方法]利用氨基酸分析仪对芦笋茎不同部位氨基酸含量及组成进行测定和分析。[结果]18种
本文意在从马克思哲学对近代启蒙思想传统的批判、出离与超越的视角,展开一项有关马克思哲学的发生学研究。本文不仅结合近代启蒙的语境对青年马克思的思想发展与转变进行了
以山西临汾热电工程中氨法烟气脱硫为例,从反应原理、工艺流程、塔结构设计等几个方面对氧法脱硫塔进行设计与优化.
目前,现有的问卷调查系统良莠不齐,大部分需要付费使用,而且会造成高校师生的数据资源不易采集。为此,本文建立在校师生自己的定制化问卷系统。首先进行了总体架构设计、功能