基于VGGNet的图像识别与目标检测

来源 :燕山大学 | 被引量 : 0次 | 上传用户:whfork
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉发展方兴未艾,深度学习之势如火如荼,得益于硬件水平的提升与理论的完善发展,图像识别和目标检测也被广泛研究并应用在生活的方方面面。其中图像识别主要应用在诸如信息化安全、人机交互、刑侦、生物医学等领域;而目标检测则在智能监控、工业缺陷检测、自动驾驶等场景有普遍的应用。图像识别和目标检测技术为生活提供了诸多便利与安全,因此,进一步研究图像识别与目标检测具有重要的现实意义。VGGNet作为经典的深度学习网络模型之一,其模型思想不仅影响着深度学习技术的发展,其本身也广泛应用在各种图像识别中,而在目标检测模型中,例如SSD模型更是使用VGGNet作为模型的主干网络,但是,在机器学习中,没有哪一种模型能够在任何场合都得到较好的效果,因此,针对应用场景不同,本文在VGGNet模型基础上改进以使其能够更好的应用在图像识别和目标检测领域。本文的具体工作为:(1)设计了降采样模块来替代VGGNet中部分的池化层,该模块能够防止模型丢失重要的语义信息;并针对人脸表情识别这一任务设计了加权损失与预定义聚类中心损失联合监督的损失函数。所改进的算法在FER2013、CK+人脸表情数据集上验证,结果表明,所提模型大大提高了人脸表情识别的精度。(2)SSD系列作为经典的目标检测模型,使用VGGNet作为主干网络,但是仍存在着对小目标检测效果较差的缺点,因此,针对这个问题,本文设计了跨通道融合模块(CF)进一步改进SSD模型,并利用周期振荡衰减学习率来防止模型进入局部最优的情况,所设计的模型在MSCOCO和VOC2007目标检测数据集上进行了验证,实验结果表明,所设计模型具有较好的检测效果。
其他文献
推进大中小德育一体化建设是我国实现教育高质量发展的一项重要战略举措。吉林省红色文化资源富集,有着独特的育人价值。红色资源是可以融入德育一体化建设的,因为“政策驱动”“实践导向”“目标一致”等因素为其融入提供了一定的可能性。吉林红色资源有效融入大中小德育一体化建设的方案多种多样,具体可归纳为:创设红色文化情境,增强德育实践体验;整合红色旅游线路,协同横向德育资源;挖掘红色资源价值,培育学生主体意识,
图像分类是计算机视觉领域中最基础的研究课题之一。目前为止卷积神经网络被证明是解决图像分类任务最有效的方法之一。但随着网络层数的不断加深,目前卷积神经网络主要面临两个严峻的问题:一是由于数据集规模不足导致的过拟合问题;二是由于网络权重参数过多造成的参数冗余严重问题。本文针对以上两个问题进行了研究并提出了相应的解决方案。主要研究内容及解决方案如下:(1)在图像分类任务中,针对网络权重参数过多而数据量不
在现实世界中,大量的数据往往使用张量来表示。例如,磁共振成像(MRI)图像由三阶张量构成;视频数据中的每一帧由三阶张量构成。张量数据包含了大量的非线性信息,例如数据之间的结构信息,与向量数据相比,更能反映样本的真实情况。作为机器学习算法中经典的算法——支持向量机,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。孪生支持向量机(Twin-SVM)和单分类支持向量机(OC-SVM)是支持向
随着传感器技术、通信技术以及微处理技术等技术的发展,无线传感器网络改变了人与自然的交互方式,影响着人类的生产生活。状态估计对于理解系统的动态行为和执行一些控制任务具有重要的意义。由于分布式无线传感器网络中的传感器可能是物理暴露的,通信网络是共享的,攻击者以隐蔽等不可预测的方式破坏传感器网络的功能,增加了分布式安全估计算法设计的难度。因此,本文针对无线传感器网络存在的上述问题,研究了攻击建模、检测机
德育一体化,从正面角度讲,就是要注重学校德育的科学化和系统化,提高学校德育的专业化水准。其中,一体化的内容包含了德育的政治立场和价值方向、内容、学段、学科、资源、主体、路径、评价等各个维度。对学校来说,就是要按照正确的方向,确定适当的目标,提供明确的内容,按照科学的方式,各主体、路径、要素协同配合,以协调一致、科学有效的方式对学生进行道德和价值观教育。一体化的反面是碎片化、割裂化、原子化,意
期刊
经济调度是电力系统经济运行中的经典优化问题,解决该问题能够缓解能源危机、减轻环境压力。经济调度具有非线性、非凸、高阶、不连续的特点,在求解过程中容易出现求解精度差,结果不稳定等问题。而智能算法中的人工藻类算法具有计算结果精度高,输出结果鲁棒性强的特点,可以用其来解决经济调度问题。基于此背景,本文将人工藻类算法的改进方案应用到经济调度问题当中。具体安排如下:首先,研究了以机组燃煤成本最小为目标函数,
随着我国科技水平的不断提高和通信技术的广泛应用,传统的电力系统已经逐步发展成为具备信息物理融合系统特征的智能电网系统。然而,由于智能电网对通信技术的过度依赖,其系统具备复杂性和开放性等特点,对智能电网系统的安全性进行研究是十分迫切且具有重要意义的。考虑到智能电网系统结构特征和假数据注入攻击的行为特征,本文将对智能电网系统可能遭受的假数据注入攻击进行防御研究,主要工作如下:首先,针对智能电网系统可能
随着国家经济的迅速发展,对能源的需求逐渐增加。而传统化石能源由于不可再生变得更加稀缺,并且对生态环境也有不可逆转的危害,因此在国家的大力支持下,可再生的清洁能源发展迅猛,其中风力发电由于成本低、环保性强等优点,取得了重要发展地位。然而,风力发电的间歇性、随机性和不稳定性等特征,给电网安全稳定运行和电能调度问题带来了严峻的挑战,因此实现对风速的准确预测具有极其重要的意义。本文基于某风电场实时采集的气
21世纪全球兴起了脑科学研究潮流,欧盟、美国、日本和中国等纷纷启动了长期的、大规模的脑科学计划。脑科学研究表明,认知、行为和感知等大脑功能源于大脑皮层系统中的集体神经振荡,集体的非线性动力学是皮层神经振荡的核心,而异常的动力学过程会引起诸多脑疾病。因此,开展与神经振荡调节相关的理论研究至关重要,可以为人类认知功能的神经机制和脑疾病的病理机制的理解提供科学依据,为人类认知功能的增强以及发展有效的脑疾
随着社会的不断发展,人类对于能源的需求也在飞速增长,传统的能源系统逐渐难以满足人类的需求。综合能源系统可以实现能源子系统之间多能互补、协调规划以及灵活利用成为了电力工业未来发展的重要方向。综合能源系统的研究中电力价格的波动风险问题一直以来是众多学者关注的重点问题。电力价格波动的主要原因是人为投机行为以及输电阻塞所导致的系统供需失衡。本文基于信用评级机制和分布式算法,重点研究了综合能源的市场机制设计