基于卷积神经网络的目标跟踪与表情识别算法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:sk01230147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于卷积神经网络的目标跟踪和表情识别算法已经被广泛用于多个领域,如视频监控,人机交互和自动驾驶等。然而,在无人机和云台自动跟踪等领域中,算法不仅需要对目标进行实时跟踪,而且还需要自动获取目标并识别。此外,在一些跟踪的应用场合,例如,对犯罪嫌疑人,逃票者和作弊者等跟踪,还需要对跟踪的人物目标进行人脸表情识别,以进一步判断该目标是否为真正的违法者或者违纪者。因此,对目标跟踪算法的研究以及跟踪人物的人脸表情识别具有非常重要的研究意义和应用价值。虽然,目前的单目标跟踪器能够在多个基准测试中获得较好的性能,但是它们仍无法自动检测到目标的类别。而多目标跟踪器由于存在漏检和误检等缺点,造成了其跟踪精确度和鲁棒性较差。此外,上述跟踪器大多不具备自动获取目标的功能。而对于跟踪目标的人脸表情识别,目前基于深度学习的人脸表情识别算法在实际场景中的识别效果仍不是很理想,在识别准确率和模型参数上仍有较大的提升空间。因此,为了解决上述目标跟踪和人脸表情识别算法存在的问题,本文主要开展了目标跟踪和人脸表情识别的研究,完成的主要研究工作如下:1、一种改进的基于卷积神经网络的目标跟踪算法(1)提出了一种改进的目标跟踪算法(YOLOv3-DWSiam RPN),该算法主要由检测网络(YOLOv3)、智能选择策略、更深更宽的孪生网络(DWSiam RPN)和卡尔曼滤波器组成,实验结果表明:该算法能够在复杂的背景环境下,自动获取目标并实时跟踪和检测目标(26帧/秒),其在COCO数据集的检测平均精度(m AP)为55.5,在VOT-2017数据集的目标跟踪平均重叠率(EAO)为0.30,具有较高的检测和跟踪精度以及较强的鲁棒性。(2)为了自动获取感兴趣的目标,本文提出了一种智能选择策略,该策略根据四个影响因素(类别,面积,检测精度和速度)计算出物体的分数值,并将最高分值的物体作为感兴趣目标。同时,该策略能够根据不同的应用场合设置相应的参数,具有较高的灵活性和可扩展性。由于该策略是检测网络与跟踪器的关键连接部分,其为目标检测与跟踪算法的有效结合提供了有价值的参考。(3)针对目标存在被遮挡和短暂消失等问题,本文结合了卡尔曼滤波算法对短暂丢失的目标进行预测,实验结果表明:采用卡尔曼滤波算法能有效地解决匀速运动的目标短暂消失等问题,具有一定的实际应用价值。2、一种基于改进残差网络的人脸表情识别算法(1)为了进一步提高表情识别的准确率,本文提出了一种基于残差网络(Res Net)和压缩与激励网络(SENet)的人脸表情识别算法(SE-SRes Net18)。首先,该算法针对表情识别数据库存在训练数据较少等问题,采用了随机裁剪以及水平翻转两种数据增强的方法对数据进行扩充;其次,为了提高识别精度,该算法在改进残差网络的基础上嵌入了压缩与激励网络;最后,为了防止过拟合,该算法在平均池化层和全连接层之间增加了裁剪(dropout)机制。实验结果表明:提出的人脸表情识别算法(SE-SRes Net18)在两个人脸表情识别数据集(FER2013和CK+)上的识别准确率分别为74.14%和95.25%。与目前先进的表情识别算法相比,不仅提高了人脸表情识别的准确率,而且减少了网络模型的参数,性能得到了一定的提高。(2)为了探究网络深度对人脸表情识别(FER)准确率的影响,本文在SE-SRes Net18网络的基础上增加了多个卷积层,设计出了一种26层的SE-SRes Net26网络模型。实验结果表明:与SE-SRes Net18算法相比,进一步增加SE-SRes Net算法的网络层数,并没有提高算法在FFE2013和CK+数据集上的表情识别准确率(73.59%和94.34%)。(3)针对SENet不同缩减比例r对SE-SRes Net18性能的影响,本文在SE-SRes Net18网络的基础上,设计了一个r=4的网络模型(SE-SRes Net18_r4)。实验结果表明:与SE-SRes Net18算法相比,进一步减小缩减比例r,并没有提高算法在FFE2013和CK+数据集上的表情识别准确率(74.06%和94.44%)。3、一种在线人物目标跟踪和表情识别系统为了验证YOLOv3-DWSiam RPN和SE-SRes Net18算法在实际应用场景中的性能,本文结合最新的Center Fcae人脸检测器,设计出了一种在线人物目标跟踪和表情识别系统,该系统由目标检测与跟踪模块(YOLOv3-DWSiam RPN)、人脸检测模块(Center Face)和表情识别模块(SE-SRes Net18)组成。实验结果表明:该系统能够在复杂背景环境下自动获取感兴趣的人物目标,并对该目标进行自动跟踪和人脸表情识别,具有较好的潜在应用价值。
其他文献
中国二手房中介行业经过较长时间的发展,整体市场中还存在着一些不规范的现象,现在中介行业的市场营销模式虽然已趋多元化,但仍然是以传统的直营连锁店铺式营销模式为主,这种营销模式造成了高成本以及同质化的激烈竞争。同时,现阶段国家对房地产市场进行宏观调控,坚持房地产产业转型,调整产业结构。海南的房地产不仅仅是一个产业,更是带动其他相关产业,事关全局的重要行业。在海南自贸港建设的初期,坚持“房住不炒”,是推
自《壮文方案》(草案)颁布以来,广西壮汉双语教育事业已经推行60多年。壮汉双语教育的发展过程中,壮汉双语教师队伍建设对于广西壮汉双语教育的持续健康发展至关重要。壮汉双语教师研究近年来为学界关注,已有研究探讨了壮汉双语教师队伍建设的相关问题,梳理了壮汉双语教师的师资现状和建设路径,但较少讨论壮汉双语教师专业发展的议题,也鲜少涉及不同阶段的壮汉双语教师专业发展的故事。因此,本研究以壮汉双语教师专业发展
学位
乡土景观是乡村、乡镇范围内包含地理环境、社会结构、生活方式和审美倾向的地域性文化景观。下楞村作为乡土景观的空间载体,记载了不同时期乡土景观的演替过程,乡土景观体现了下楞村民生存方式和民俗民风。目前,快速城镇化使下楞村的自然环境和社会环境发生变化。除了极少的具有文物价值的乡土建筑得以迁建和保护,绝大多数乡土景观或是没入水底、或是破败不堪,下楞村的乡土景观普遍呈现出空间衰败、价值失落的特征。在对下楞村
进入新世纪,中国与世界各国的文化交流、学术研讨、技术培训日益增多。随着现代技术的高度发达,远程办公、远程会议成为了21世纪交流的重要组成部分,因此,远程课堂也自然成为开展学习研讨交流的重要场所,及时解决了由于地域、人员、经费不足带来的各种问题。此外,受今年新冠病毒疫情的影响,学校等人员密集场所无法正常授课,开展线上教学成为教师学生唯一的选择。由于以上特殊性,针对这类远程课堂口译项目的研究有助于帮助
本研究以《全唐五代诗》《全唐文》《全唐文补编》《历代辞赋总汇(唐代卷)》与《唐代墓志汇编》及其续编中辑录的盛唐诗文为研究材料,整理盛唐诗文用韵,运用用韵空间分布综合评价方法对盛唐诗文用韵的空间分布普遍性状况作全面描写和统计,归纳盛唐诗文韵部系统,分析其通语性质。通过与诸家盛唐韵系、《广韵》“独用”“同用”、基于韵段用韵归纳比较方法的盛唐韵系的比较,对诸家韵部的语音性质作出判断。本研究共分为六章。第
本文主要着眼于出口增加值贸易强度视角,利用OECD-WTO TIVA投入产出数据库,依据拟相关系数法和出口增加值分解框架,对2005—2015年东亚区域经济一体化和增加值贸易强度的整体和局部情况分别进行了测算。通过构建动态面板模型,实证分析了东亚增加值贸易强度对东亚经济联动的影响效应。研究发现:(1)东亚区域经济整体联动性呈“W”型变动趋势。中日韩与东盟更具有经济联动同步性,而中日韩三国的经济联动
由于2020年全球新冠疫情大流行,众多国家纷纷暂停线下授课,转而选择线上授课。在此背景下,一批申请在菲律宾攻读教育学硕士的中国教师选择在中国接受该大学的线上授课,但由于语言不通,所以选择了笔者为本次线上授课提供交替传译服务。为了保证课堂授课的流畅性,笔者为本次远程课堂口译提供中英双向翻译。笔者以本次口译实践为例,对笔者翻译问题进行分析,从中汲取经验。本文分为任务介绍,任务描述,案例分析和结论四个部
电化学发光(ECL)是电化学与化学发光巧妙结合起来的一种分析检测技术。电化学发光免疫传感器以电化学发光信号作为检测信号的分析装置,具有较高灵敏度、高选择性、线性范围宽、操作简单、背景信号低和快速响应等优点而备受青睐,并在环境分析、药物分析、食品分析和免疫分析等领域展现了良好的应用前景。恶性肿瘤已成为威胁人类健康的一大杀手,早期发现和诊断对肿瘤的预防和治疗至关重要。为了实现对肿瘤标志物的高灵敏检测,
现代意义上的和声学诞生并发展于欧洲启蒙运动与工业化革命的背景下。和声学理论探索的过程中借鉴数学与自然科学的研究思路,以科学化、标准化的思维解释音乐现象,创建具有“精确量化性质”的理论,并以此来指导实践成为传统和声理论的重要诉求。平行、方正、功能、对称、循环、集合、偶然等重要和声理论术语及其背后的观念均来自数学等学科。
期刊