【摘 要】
:
随着中国经济的腾飞和国家城镇建设的加速,人群密集的公共场所及监控设备的数量大量增加,传统监控设备的用人成本也成为了不得不考虑的问题。所以急需一种能够代替人工对视频监控进行实时异常事件检测,由此新一代智能监控设备的研发提上了日程。作为该监控设备的一项核心功能,视频异常事件检测算法是目前最重要的攻关技术难点。现有的异常检测算法存在两个问题:标注的异常视频数据集较少和不同场景下的异常检测模型需要重新设计
【基金项目】
:
国家自然科学青年基金(NSFC61704046); 河北省自然科学基金(A2019202190); 河北省自然科学基金(A2020202067);
论文部分内容阅读
随着中国经济的腾飞和国家城镇建设的加速,人群密集的公共场所及监控设备的数量大量增加,传统监控设备的用人成本也成为了不得不考虑的问题。所以急需一种能够代替人工对视频监控进行实时异常事件检测,由此新一代智能监控设备的研发提上了日程。作为该监控设备的一项核心功能,视频异常事件检测算法是目前最重要的攻关技术难点。现有的异常检测算法存在两个问题:标注的异常视频数据集较少和不同场景下的异常检测模型需要重新设计。针对以上两种问题,本文提出一种基于视频预测的异常检测方法,基于弱监督学习进行设计,不需要对视频中的异常帧进行特别的标注,就可对视频中的异常事件进行检测和定位,针对正常事件进行建模,因此可应用在大多数监控场景,不需要对模型进行特别设计。本文的主要研究内容如下所示:(1)针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,改进提出了一种动态卷积生成对抗网络(Convolutional Dynamic Neural Advection Generative Adversarial Network,DC-GAN)。该方法首先使用Conv LSTM初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元(Convolutional Dynamic Neural Advection,CDNA)对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧。实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是视频帧图像中物体的运动趋势预测上,DC-GAN均优于同类型的方法。(2)本文以公开场景下视频监控中的异常行为和事件作为研究对象,改进提出了一种基于动态卷积生成对抗网络的视频异常行为检测算法。该方法基于弱监督学习方法进行设计,不通过重建训练数据来进行异常检测,而是将异常数据和预期的正常数据进行比较来进行视频异常事件的检测。模型生成网络基于U-Net网络,结合卷积神经动态平流单元作为动作预测模块,引入一种基于光流估计的运动损失,保证了动作预测模块的作用。判别网络是由一个3D卷积网络和全连接网络构成的二分类网络,该网络能够一次性接收整个视频序列,并判断出视频是不是预测视频。(3)本文在CUHK数据集、UCSD数据集和Shanghai Tech数据集三个数据集上进行了损失函数的消融实验,并且与现有主流视频异常检测算法进行了对比实验。在AUC-ROC和Δs等评价标准上对相关网络进行了评估。经过充分实验,本文所提出的模型在三个数据集上均取得了较高的准确度,其中对UCSD数据集的实验中,在AUC和Δs指标下分别95.3和0.432的最好结果。本文提出的基于DC-GAN的视频异常检测算法,在三个数据集下都表现出了较高检测准确性和鲁棒性,能够对监控视频中的异常事件进行准确识别和定位,并且实现了检测速度和精度较好的平衡。
其他文献
原子光谱Stark展宽法是计算等离子体电子密度最主要的方法之一。然而,该方法计算步骤复杂、参量繁多,常常使用简化方法进行计算,显著影响电子密度的计算结果。本文将基于Stark展宽原理设计和开发等离子体电子密度分析程序,结合复误差函数从Voigt线型提取Gaussian展宽和Lorentzian展宽,并通过NIST原子光谱数据库和相关文献计算获得多种谱线展宽,得到Stark展宽从而估算等离子体电子密
我国商业空间的发展已进入存量时代,随着人们消费需求的不断升级,以传统商业街为代表的实体经济不断受到电商的冲击,商业街景观空间的设计迫切需要新的视角进行研究,以探寻解决复杂空间矛盾的思路,使商业街重新焕发活力。列斐伏尔的理论突破了将空间视作容器的传统研究思维,他认为日常生活或者说社会关系支持和生产着空间,但其中的“日常性”在今天是消极的,我们的城市生活就因循在这种缺乏活跃的日常性的日常生活之中,不能
当前,我国城市发展已进入城镇化成熟阶段,城市空间发展面临着由增量拓展向存量更新转变的新常态。党的二十大报告提出了“推进高质量发展,推动构建新发展格局,实施供给侧结构性改革”的要求,使得探索高质量发展成为推动城市转型的研究重点。特大城市高新区存量工业用地当前面临着空间发展困境亟需借助更新释放发展潜力,而存量工业用地更新作为城市空间高质量发展的重要抓手,也是助推新旧动能转换的重要驱动力。因此,研究特大
随着信息技术的发展和经济的飞速增长,高精密时间频率标准在各个领域发展中的重要性愈加凸显。在很多科学研究领域,如精密计时、现代通信、导航定位和计算机自动控制等都离不开精密时间尺度和时间频率测量技术。精准时间频率信号源于高可靠的原子时标系统,本文侧重于原子时标以及相关理论的实现方法研究,在理论分析与数值仿真的支撑下探究了综合时标算法中信号预测、时标产生和频率驾驭的关键技术,提出了相应的问题和创新性的解
在人类正常行走的过程中,趾关节在支撑末期与地面接触并且储存能量,为摆动期提供一定的助力。然而,在现有的膝上假肢中,假脚是一个单分段结构,这会导致截肢者没有明显的支撑末期,消耗更多的能量,截肢侧与健全侧步态不协调等。针对这些问题,本论文设计了一种具有膝-踝-趾三个关节的假肢结构,构建了假肢步态切换控制系统,该步态切换控制系统可以针对截肢者的不同步态阶段,选择不同的控制器,使假肢在不同的运动状态间平稳
对鸡菌(Termitomyces sp.)生长的表层土(St,5 cm)、中层土(Sm,5 cm)、里层土(Si,5 cm)以及巢腔壁(Cw)和菌圃(Fc)样本进行细菌16 SrDNA高通量测序,分析样本间细菌群落结构的变化。共获得567379条质控序列,这些序列按照相似度大于97%为一类的标准,被归为3202个操作分类单元(operational taxonomicunits,OTUs),这些O
肇始于医疗领域的知情同意规则,历经时间的发展与检验,在个人信息保护领域也渐被奉为圭臬,成为规制个人信息处理活动的“帝王条款”,其地位犹如意思自治之于民事法律。知情同意规则的重要性虽在大多数国家的个人信息保护规范中不断得以重申与确认,但其现实适用却并非没有争议:其一,在信息处理技术的加持之下,信息处理者与信息主体之间客观存在且不断加大的信息鸿沟、能力势差,致使知情和同意环节的有效性均面临诸多批判;其
在新型城镇化发展理念下,随着我国老年人口的快速增长,如何促进城乡养老公平成为了学者们研究的重点。养老设施作为公共服务设施体系的重要组成部分,承担着社会养老的职责,建立覆盖城乡、布局合理的养老设施有利于缓解养老压力,促进城乡养老公平,缩小城乡发展差距。先前的学者对于养老问题的研究集中在城乡老年人的养老意愿和养老需求的调查分析、养老模式的选择、养老设施的用地适宜性评价等方面,而对养老设施布局的研究相对
随着科学技术的不断创新与快速发展,学术成果如雨后春笋般涌现,科研工作者们往往将自己的学术论文发表在学术期刊或杂志上,然而如何在大量学术期刊中选择合适的期刊进行投稿,受到众多科研工作者的迫切关注。目前学术期刊推荐方法大多利用论文内容特征或学术社交网络进行推荐,若论文数据库未收录论文全文信息,基于论文内容特征的推荐算法便难以满足用户的期望,普适性和鲁棒性较差;基于学术社交网络的推荐算法因粒度粗和信任关
随着互联网和电子商务的飞速发展,网络上产生了大量有用的评论信息,通过对这些文本进行情感分类,可以分析出人们对某个商品或某件事的观点及态度。但是除英语外的其他语言缺乏高质量的情感资源,限制了情感分类在这些语言中的发展,跨语言情感分类能很好的解决这一问题。跨语言情感分类的目的是使源语言的情感资源更好的应用到目标语言中进行情感分类,算法的关键是弥合两种语言之间的差异,高效提取出单词的语义信息和情感信息。