基于深度学习的视频分析系统

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zoec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每分钟都要海量的视频通过互联网共享出去,著名视频分享网站youtube每分钟上传视频的总时长达100+小时,所以很有必要对这些视频分类检索方便用户选择兴趣内容以应对多媒体信息大爆炸。并且合理的分析理解这些视频对于网站对于提高网站流量,网站业务分析都有很大的作用。本文通过将深度学习与视频分析技术相结合,提出了一种基于深度学习的视频分析系统。该系统使用深度学习中的C3D网络和CNN网络来提取出背景特征和行为特征,然后将提取出来的特征通过多层LSTM网络,经过一系列的加权操作,将背景特征与行为特征依据加权后的可能性组合成描述以完成视频的描述分析工作。为了高效准确的识别出视频中出现的背景和动作特征,本文提出了一种基于CNN模型的改进模型架构——C3D模型。相对于传统CNN模型,C3D模型对CNN中的卷积(convolution)操作和池化(pooling)操作进行改良,即针对视频的时序特征在原有与空间序列关联的基础上添加了时序特性,即3d convolution操作和3d pooling操作,使得能够提取和保持更多的特征,提高背景识别和动作行为识别的准确度。为了将提取出来的特征有效合理的组成有效描述,本文提出了一种基于LSTM模型的多层LSTM模型。C3D顶层所提取出来特征趋向于关注于全局视觉感知视野,而那些底层所提取的特征更加关注于精细、局部的特征,一个有效准确的描述不应该只关注于顶层的宏观特征,而是应该结合底层细节特征共同对于视频内容进行描述。对此我们提出了多层LSTM模型同时提取底层特征和顶层特征来更加准确的描述视频的内容。最后本文陈述了具体的基于深度学习的视频分析系统的主要功能模块的实现和实验数据结果。通过对这些结果分析,系统满足实际需求,具有较强的工程价值和实用价值。
其他文献
第一章总则第一条为加强旅游市场管理,保护和合理开发利用旅游资源,保障旅游者和旅游经营者的合法权益,促进本省旅游业的健康发展,根据有关法律、
水土保持区划可为区域水土保持规划与宏观管理、水土保持生态文明建设提供重要的参考。在《江西省水土保持区划及防治布局研究》确立的原则与方法的基础上,根据全国、全省和
5月24日至25日,国务院总理李克强在潍坊、济南考察减税降费对制造业企业受益情况和缓解小微企业融资难融资贵情况等,并于24日主持召开部分地方减税降费工作座谈会,部署进一步落
报纸
<正> 病人在住院期间,一般平均用8种不同药物,麻醉时有时还要添5~10种。因此,熟悉这些常用药物之间的相互作用,对保证麻醉安全就很有必要。药物相互作用的机理一、物理或化学
作为临济宗杨岐派的创始人杨岐方会,在当时丛林之中,无论声望或影响力,他都不及同时代的雪窦重显、黄龙慧南等禅师,但在其身后却兴起了一个强盛的禅宗派别一杨岐派。杨岐派成
各市、县人民政府,省政府各部门、各直属机构: 受高致病性禽流感疫情影响,当前我省家禽业发展受到较大冲击,特别是规模家禽生产企业损失较重。
维特根斯坦是西方哲学史上一位划时代的哲学家,他的思想在很多人文社会学科中的影响都广泛。后期维特根斯坦提出的语言游戏思想不仅是语用学研究的基石,也为翻译研究带来很多
目的:了解慢性重型乙型肝炎的常见并发症,探讨对其观察、预防术后并发症。方法总结88例慢性重型乙肝肝炎患者并发症的观察要点和护理要点。结果:并发症中腹水发生率最高,为85
9月22日,省十二届人大常委会第二十三次会议听取和审议了省人大常委会执法检查组关于检查中小企业促进法律法规的报告和省政府关于全省中小企业发展情况的报告.省政府关于全
随着全球贸易和投资进一步趋向区域化和自由化,我国边境城市的边贸发展面临着严峻的挑战。挑战意味着存在风险,也意味着存在机遇,哈尔滨市必须抓住机遇,积极地迎接挑战。 哈