【摘 要】
:
在当今社会,随着传感器和计算机视觉技术的发展,人们对视频监控自动化和智能化技术有了更多的需求和研究。前景检测作为计算机视觉领域的基础技术,目的是将运动的前景物体从相对静止的背景场景中分离出来,是计算机视觉分析理解任务中的第一个问题。由于应用场景的复杂性,目前传统前景检测算法性能面临瓶颈。提高算法准确性、增强算法实时应用能力,以及提高算法鲁棒性是前景检测技术的研究重点。本文首先针对阴影和颜色伪装等应
论文部分内容阅读
在当今社会,随着传感器和计算机视觉技术的发展,人们对视频监控自动化和智能化技术有了更多的需求和研究。前景检测作为计算机视觉领域的基础技术,目的是将运动的前景物体从相对静止的背景场景中分离出来,是计算机视觉分析理解任务中的第一个问题。由于应用场景的复杂性,目前传统前景检测算法性能面临瓶颈。提高算法准确性、增强算法实时应用能力,以及提高算法鲁棒性是前景检测技术的研究重点。本文首先针对阴影和颜色伪装等应用场景,研究基于颜色和深度信息融合的前景检测算法。其次,本文提出基于矩阵分解和数学优化的前景检测框架用以解决光照、水波纹及摇摆树叶等动态背景的应用场景,并针对该框架下的计算资源消耗问题从三个方面提出了解决方案。最后,本文研究基于深度学习神经网络的前景检测框架,从优化训练数据、轻量化网络结构、及多尺度特征图模块参数优化三个方面进行改进,并通过大量实验验证前景检测效率。本文的主要工作和研究创新点如下,1、为了提高传统前景检测算法在阴影和颜色伪装场景的精度和鲁棒性,本文通过颜色信息和深度信息融合来提高前景检测算法的性能。背景模型选用传统算法中实时性好、检测率高、适应性强的算法——Sub SENSE(Self-Balanced SENsitivity SEgmenter),Sub SENSE是传统前景检测算法里,该模型初始化时建立无参数样本模型,使用时序信息和邻域纹理信息组成样本集合,检测过程通过计算背景可信度矩阵、噪声累加矩阵、距离阈值矩阵、以及更新概率矩阵这四个状态矩阵,进行局部动态阈值设置以及像素自动分类,即使在光线变化或者动态背景应用场景里也表现突出。但算法有一个缺点,即当前景与背景相似时,算法本身的更新策略会降低像素的前景检出率。本文针对该问题,提出深度信息和颜色信息融合方法,该方法对阴影、颜色欺骗、深度欺骗等问题进行处理,能提升算法的前景检出率,解决阴影和伪装场景下前景检出率不高的问题,并且在数据集上实验验证,证明融合策略能够大幅度提高前景检出率。2、针对基于矩阵分解前景检测框架下对资源消耗问题,根据视频计算中前景目标的特性,改进稀疏矩阵计算优化算法的优化目标,并利用快速交替优化算法对目标函数中的变量进行交替更新求解,在对目标函数中的低秩矩阵进行优化求解时,按照奇异值大小进行分阶梯求解,极大程度降低了计算时间复杂度。其次针对视频数据中大量的视频帧对计算资源和存储资源的消耗问题,提出了帧筛选算法,通过对长视频帧中的冗余帧进行筛选,提高对数据的处理效率,在保证信息完整性的同时,大大降低数据的维度,可以有效降低参与矩阵分解的数据量,降低基于矩阵分解的前景检测算法对计算资源的消耗。最后提出基于字典的在线优化算法,解决传统矩阵直接批处理全部视频数据、对内存空间以及计算资源要求高、消耗大的问题,研究使用在线更新的策略解决矩阵分解一次性将所有输入数据批处理放入内存中等待计算,批处理的数据处理形式对存储资源和计算资源要求较高的问题。通过使用在线更新的策略来解决矩阵分解问题,相较于批处理操作,在线策略真正意义上解决了算法对存储空间和资源的消耗问题。3、研究基于深度卷积神经网络的前景检测框架。首先针对训练数据类别不均衡的问题,研究并提出在对正负样本进行筛选和均衡处理,通过从样本集中筛选出有包含有效信息的样本进行训练,减少无效训练样本个数,解决了随机挑选样本以及类别样本数量相差太多情况下分类器不稳定问题,本文实验验证了该方法可以使用少量手工标注样本对数据集进行建模,在保证检测效率的情况下,极大降低了人工标记的工作量。其次针对模型训练时间长及参数规模大,提出轻量化模型,将当下最新的轻量网络结构应用到前景检测中,解决了参数模型太大的问题。最后,结合训练样本筛选均衡策略以及轻量化网络,针对多尺度空洞卷积由于不合适的扩张率会切断局部像素点之间的连续性,造成局部信息丢失,提出了使用合适的多尺度空洞卷积进行特征提取和融合的残差网络,该算法能够在提高检测效果的同时,大大降低参数模型的大小,提高检测速度。无论是从底层对网络进行改进和扩展,继续提高检测效果,还是移植到移动端进行后续应用开发,该网络结构都非常灵活。最后算法在数据集上验证了其有效性。
其他文献
近年来,人工智能技术迅猛发展,在全球范围内受到了广泛关注。以卷积经网络(Convolutional Neural Networks)、图卷积神经网络(Graph Convolutional Neural Networks)为代表的深度学习算法的不断更新迭代对计算机系统的计算性能与能耗要求急剧提高。然而,由于近年来摩尔定律发展的停滞以及冯诺伊曼结构限制,现有的数据中心架构无法高效地实现深度学习与大数
场景重建与语义分析理解是计算机视觉、计算机图形学以及机器人学中的难点。随着工业和娱乐领域对数字几何需求的不断增长,对场景进行建模与分析理解比过去任何时候都更加重要。近年来深度扫描技术的快速发展使得场景的数据建模越来越便捷,由于这一技术的革新,场景的重建和语义分析技术经历了由简单到复杂以及由低维到高维的发展演变。另一方面,移动机器人经过多年的研究和发展,已经逐步走向实用化,在制造业、物流业、服务业等
从片上多核系统到高性能计算机系统,互连网络作为节点之间通信的基础部件,一直是限制系统性能提升的瓶颈。路由器是互连网络的基础结构单元,负责网络中报文的转发,是影响网络吞吐率和报文传输延迟的关键部件。路由器基本结构包括输入端口、缓存、交换开关和输出端口等。其中,缓存用于存储路由器中等待转发的报文,而交换开关负责将报文无冲突的从路由器输入端口转发到输出端口。片上网络通常通过简化路由器流水级来降低报文通过
计算机生成兵力(Computer Generated Forces,CGF)战术任务规划是在作战仿真系统中,CGF为达到其作战目的而进行的一系列规划推理和选优决断活动,是构建真实可信的作战仿真系统的重点和难点。目前的CGF战术任务规划行为建模技术存在领域知识获取困难、战场环境不确定、行为模型过于简单等问题,针对这些不足,论文以研究CGF行为建模中战术任务规划行为模型框架为目标,重点围绕战术任务规划
随着云计算技术的快速发展,云服务商为用户提供了性能强大且具有弹性的数据存储和计算资源,将数据挖掘工作外包至云环境可以显著降低用户的运行维护成本。然而,由于云环境存在数据泄露等多种安全威胁,且云服务商对于用户而言不完全可信,用户的外包数据存在隐私泄露的风险。因此,如何保证云端数据挖掘过程中数据和结果的安全性已成为云计算安全领域亟待解决的关键问题。现有的数据挖掘安全外包方案通常无法同时满足高安全性和高
云计算技术在军事、政府、企业和个人等领域取得了越来越广泛的应用,但伴随着频频发生的云数据泄露事件,其安全问题也逐渐凸显。由于用户失去了对外包至云端的数据的直接物理控制权,同时又不愿意完全信任云服务提供商,因此数据的安全和隐私问题就成了用户在使用云服务时的重要顾虑。在上传数据前使用传统的对称或非对称加密算法加密数据可以有效保护数据的机密性,但无法满足灵活、高效地共享和管理数据的需求。属性基加密作为一
区块链是在分散对等的协作主体之间就共同关注的数字证据达成共识,并在此基础上开展合作的分布式存证机制,具有多中心、防篡改、可追溯等基本特性,能够以低成本、高效率的方式为不具备信任关系的各利益主体构建信任,并促成群体之间的高效协作。区块链技术不仅能够以分布式账本的形式对金融行业发挥重要作用,而且在数据共享、信息安全等众多领域也有广泛的应用前景。共识技术作为区块链的核心技术之一,逐渐成为了学术界和工业界
目前,医学数据正在急剧增长,来自区域医疗诸多医院的病历文本数据、医学检验数据和影像数据迅速汇聚,为疾病的筛查、诊断和治疗带来曙光。医学文本数据尤其是电子病历数据,记录了患者详细的病情和治疗过程,所含信息丰富,因此,开展医学文本挖掘中关键技术的研究,提取与某疾病相关的特征并构建相应的知识图谱,可更加科学、客观地预防、筛查疾病并给出合理的治疗方案,最终为广大患者提供更好的医疗服务,具有很好的理论和实际
运动实体广泛存在于攻防体系对抗实验等军事分析仿真应用中,其连续运动行为导致时空状态更新占据了应用大部分的通信内容,成为影响和制约运行效率的关键因素。传统的通信优化技术主要面向于提高数据传输速度或过滤冗余通信链路,并不能有效解决大规模时空数据传输引起的通信瓶颈问题。因此,开展以减少时空状态信息通信量为目标的相关技术研究,对于提高通信性能,有效利用现有的计算和通信资源,满足军事分析仿真日益增长的性能需
人脑在多个时空尺度的信息交互是支撑其复杂认知和行为功能的基础,我们尝试利用磁共振成像非侵入式和较高时空分辨率的特点,研究人脑的神经信息交互机理。本文主要以静息状态下人脑的功能连接为对象,进行人脑在多时空尺度下的功能单元划分及其交互模式研究,同时探寻其结构基础。本文主要包含以下三个方面的内容:(1)人脑功能剖分方法研究。人脑的功能单元具有明显的层次性,他们之间通过复杂的功能分离和整合来完成特定的认知