基于深度学习的视频行为识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yo55an
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能视频监控是利用计算机视觉和视频图像处理的技术,对视频序列进行自动化的智能分析。作为智能视频分析的重点,基于视频的行为识别是指从视频序列中提取描述动作行为模式的显著视觉特征,然后通过机器学习与模式识别等算法进行分类和理解,来实现视频目标的行为模式的识别,属于更高层次的视觉任务,是计算机视觉和模式识别领域中极具挑战性的一个研究课题。论文主要研究并且提出了基于双流卷积架构的时空残差网络以及相关的算法和技术,并结合实际工程的相关应用展开论述。论文研究了双流卷积网络和残差网络,前者在基于视频的人类行为识别任务中取得了极佳的效果,而后者已经作为一项新技术来训练极深的网络架构。论文详细介绍了这两种网络架构,并且设计和提出时空残差网络架构,该网络是以双流卷积网络作为基础架构,并利用在大规模数据库(用于图像分类任务)上预训练好的残差网络来初始化双流中的两路网络,从而在视频的行为识别任务中能充分利用基于海量图像的训练数据。论文研究了时空残差网络的双流之间的跨流残差连接。针对原始的双流架构中只允许独立的双流通过最后阶段融合各自的softmax预测来进行信息交互而导致无法对真正的时空特征进行学习的不足,论文提出了多种可行的跨流残差连接方式,并对各种连接方法进行了详细的对比实验和分析。论文研究了时空残差网络中的时序残差连接。尽管原始双流网络中在做预测时采用了小的时间窗口(10帧)并随后对整个视频片段取平均,但在现实情况下以更大的时间间隔来采样更为合适。因此为了给时空残差网络提供更大的时域支持,论文提出了特征恒等初始化的时序卷积(即一维时序卷积结合将特征的空间变换初始化为恒等映射的方式)来实现时序残差连接。还研究了在网路的层次结构中添加时域卷积的不同方案。首先,设计了在网络整体架构中时域卷积核的不同添加位置。其次,设计了时域卷积核的不同初始化方式,即对所有的特征通道在时间上设置为平均初始化或者中心帧初始化。最后,设计了时域全局最大池化,提高了时空域的局部感受野,从而能够学习到特征之间的长期时序相关性。论文还研究了异构双流的时空残差网络。通过将双流基础架构中双流分别替换为50层和152层的残差网络以实现在不同数据集上的多任务学习。基于以上的研究,论文提出了最终的时空残差网络架构:异构双流乘法时空残差网络。为了实现对复杂时空特征的多层次学习,整个模型采用端到端的训练。在两个广泛使用的行为识别数据集上,提出的模型均到达领先的性能。
其他文献
随着各种智能终端应用的出现,以及互联网用户数的快速增加,网络流量呈爆发式增长,这对网络传输提出了更高要求。软件定义网络(Software-Defined Networking,SDN)与网络功能虚
在中职学校中,学生干部任务重、责任大,是确保学校教育目标得以实现的保障之一。因此,学生干部必须具有较高的素质及一定的组织能力和管理能力。
随着中国特色社会主义法律体系的形成,我国的法制化进程不断加速,进一步推进"依法治火"工作是公安机关消防机构在构筑社会消防安全"防火墙"工程中加强"四个水平"建设的必然要
英雄史诗《玛纳斯》是一部反映吉尔吉斯族抵抗外族侵略、保全民族生存、捍卫民族尊严的宏大民族抗争史。它表达的不屈不挠的大无畏精神和捍卫民族尊严、渴望民族统一的主题与
患者,女,25岁,因间断发热伴关节肿痛三个月,加重一周于1997年4月11日入院。入院后给予环丙沙星抗炎和双氯酚酸钠止痛,疗效不佳,经会诊诊断为风湿热,停用上述药物,给予乙酰水杨酸6.0g·d-1,为减少对胃粘
从科学计算可视化和现代地图学的发展中,介绍了当今地图学研究中的热点问题--地图可视化。认为在地图学的研究中,应重视由可视化技术带来的新的生长点,从而指导对虚拟地图、动态
复变函数积分是复变函数的重要内容。文章对复变函数积分的计算方法进行归纳,以典型例题加以说明。主要包括积分曲线的参数方程法、牛顿-莱布尼兹公式、柯西积分定理及公式、
随着空间技术、信息技术以及电子技术的迅速发展,紫外探测技术逐渐成为一种军民两用的技术,广泛地应用于科研、军事、空间探索、环保卫生、医学等应用场景中。随着人们对半导
《玛纳斯》是柯尔克孜人民在千百年的历史长河中形成的英雄史诗,是我国三大史诗、世界五大史诗之一,是中华民族文学的重要组成部分,是世界史诗中的璀璨明珠,具有极高的艺术性和浓
报纸
商业税收的管理是税收管理的薄弱环节,作为商业重要组成部分的摩托车行业,有其自身的经营规律,本人以河南嵩县为例,探索摩托车零售行业的经营特点以及在税收征管中存在的问题