【摘 要】
:
近年来,随着计算机性能的持续提升以及GPU行业的发展,人工智能中的计算机视觉逐渐成为研究热点。在计算机视觉领域中,动作识别、视频目标检测及目标跟踪因其广阔的应用前景而备受研究者关注。目前动作识别算法的研究多使用人工神经网络,普遍存在计算量大、训练时间过长的问题,多种研究表明脉冲神经网络在功耗和计算速度方面比传统的人工神经网络更有优势。因此如何在不降低准确率的前提下,减少动作识别算法的训练时长正是本
论文部分内容阅读
近年来,随着计算机性能的持续提升以及GPU行业的发展,人工智能中的计算机视觉逐渐成为研究热点。在计算机视觉领域中,动作识别、视频目标检测及目标跟踪因其广阔的应用前景而备受研究者关注。目前动作识别算法的研究多使用人工神经网络,普遍存在计算量大、训练时间过长的问题,多种研究表明脉冲神经网络在功耗和计算速度方面比传统的人工神经网络更有优势。因此如何在不降低准确率的前提下,减少动作识别算法的训练时长正是本论文所要研究的重点。本文调研了国内外手势识别算法、动作识别算法和脉冲神经网络的研究现状,并使用融合脉冲神经网络(Spike Neural Network,SNN)与传统人工神经网络(Artificial Neural Network,ANN)的网络设计实现了一系列手势识别和动作识别算法。首先,本文设计了一种融合网络结构,并使用开源数据集MNIST数据集和MNIST-DVS数据集验证该网络结构,通过对比实验确定该融合网络结构的可行性。然后,建立了一个新的手势识别数据集-Gesture数据集,基于该数据集完成实验,证明了融合网络的时间消耗少及计算量小的优势;设计了简单的实时手势识别推理模块,并测试了网络模型的正确率。Gesture数据集解决了静态手势识别图片不能体现融合网络处理时序特征的优势、而DVS相机造价高不能推广使用的问题,本文详细说明了该数据集的思路来源、采集方式和处理办法。其次,设计了两种动作识别算法。研究动作识别领域中的两种方向,设计实现了基于TSN(Temporal Segment Networks)设计的融合网络和基于3D-Resnet设计的融合网络。此外,针对UCF101数据集在动作识别研究过程中出现的过拟合问题,预处理UCF101数据集并改进动作识别算法中的网络结构,然后在不同规模的UCF101数据集下通过对比实验评估融合网络的性能。最后对本文和作者在课题期间的工作成果进行了总结,并提出了进一步的改进方向。
其他文献
近年来,深度学习图像分类算法发展迅速,并在实际应用中取得了巨大的成功。然而,有监督深度学习模型需要使用大量有标记数据和多轮迭代来进行训练。其高昂的标注成本严重限制了传统方法在全新类别的场景中的应用。更重要的是,针对这些特殊类别的大量标注样本可能很难或者不能获得,因此需要大样本数据来训练模型的条件从本质上限制了它们预测新出现的(例如,新出现的设备)或稀有(例如,稀有动物)类别的能力,从而使得原有模型
电动出租车轨迹描述了电动出租车空间位置和其他属性随时间的变化,蕴含了大量的居民出行信息,也反映了电动出租司机的充电习惯和出行特征。本文通过轨迹数据可视分析方法对深圳电动出租车的轨迹数据进行研究,并开发出电动出租车轨迹数据可视分析系统,支持多维度、全方面分析电动出租车在深圳的推广运营情况,从而对电动出租车行业的健康发展提出建议。本文的研究内容主要包括以下几个方面:1.充电事件提取及可视分析。根据电动
第五代移动通信(The Fifth Generation Mobile Communication,5G)和B5G(Beyond 5G)技术既要支持各种类型设备接入,还需满足海量数据流量需求,以支持物联网、人工智能等领域的通信业务。在一些特殊通信场景中,例如灾害应急通信、热点地区扩容,地面通信基础设施遭损坏或难以部署,使得通信质量无法得到保障。搭载无线通信设备的无人机作为空中基站辅助地面蜂窝网路,
得益于各行各业数字化、信息化、智能化程度的不断提高,人们对移动电子设备的依赖也在不断加深。这种依赖不仅体现在对峰值速率,业务时延等传统性能指标上,同时也体现在用户体验、终端续航时长等方面。为了满足这些需求,终端需要在不对传统指标造成较大影响的情况下进一步提升自身的能量效率,减少不必要的能量浪费。非连续接收机制是在提升终端能量效率方面的一项重要解决方案,这一解决方案在较早时间点就已经被引入了协议。目
近年来随着信息网络技术的飞速发展,信息流量需求飞速增长,需要建立高速率、大容量、广覆盖的空天地一体化通信网络系统。而目前卫星之间、星地之间的数据传输主要是微波为载体的通信。由于微波频率资源和技术限制,以微波为载体的卫星通信速率很难有很大提升。而卫星激光通信技术由于设备体积小、抗干扰能力强、保密性强、通信速率提升空间大等优点,为实现星间、星地高速率数据传输提供了新的解决方案。因此,卫星激光通信成为卫
在现如今的移动通信技术研究中,高速数据传输和高频谱效率是重要的研究方向,超奈奎斯特(Faster-than-Nyquist,FTN)传输技术通过压缩相邻脉冲之间的发送间隔来提高频谱效率。低密度奇偶校验卷积码(Low-density Parity-check Convolutional Code,LDPC-CC)作为前项纠错编码(Forward Error Correction,FEC)中的一种码字
雪崩光电二极管(Avalanche photodiode,以下简称APD)由于其在盖革模式下可以实现对单光子信号探测的特性被广泛地运用于量子通信、激光雷达、成像探测、地理监测等各个高精尖科技领域,受到了越来越多的关注。随着应用场景的增多,APD工作环境的温度变化使其无法维持稳定的性能。本文针对APD盖革模式下的温度灵敏性及雪崩自持特性带来的问题,形成了硅APD控制电路相关研究工作,具体研究内容如下
目前国内外的IT领域中linux内核的开发和应用已经非常普遍,应用的领域包括服务器操作系统软件、手机等便携设备、云计算、物联网、智能硬件等产品。未来linux内核的应用会更加广泛,各企业面临的机会和挑战也更多。本文在市场、技术、管理三个方面对项目管理风险进行研究,有助于企业在项目研发中识别、分析和应对风险,保证项目的准确性、有效性、进度和质量,提升产品的竞争力。本文的研究主要有以下几个步骤。(1)
新兴业务对强大计算能力、高容量、低时延和低能耗的需求,对网络性能提出了更高的要求。从移动边缘计算扩展到多接入边缘计算(Multi-Access Edge Computing,MEC),MEC作为一种有效的分布式计算模式,通过将资源部署在网络边缘就近为用户提供计算卸载服务,能够有效地降低延迟,提升服务质量(Quality of Service,QoS)。然而随着用户设备的激增,当存在大量用户竞争有限
由于Ⅲ-Ⅴ族材料在光电子器件尤其是发光器件中被广泛应用,随着硅基光电集成的发展,在硅衬底上异质外延生长Ⅲ-Ⅴ族材料引起了研究者极大的关注,其面临的主要瓶颈问题是高密度穿透位错(Threading Dislocation)的形成。在研究硅基Ⅲ-Ⅴ族材料的质量时,准确地表征其穿透位错密度是非常关键的。它可以为异变外延生长技术的改进提供依据,从而对高质量异变外延的实现起到支撑和助推作用。用来表征位错的方