【摘 要】
:
目标检测作为计算机视觉领域中的一个重要研究课题,是识别和定位任务的统一。目标检测的主要目的是定位图像中感兴趣的目标,既要给出目标的边界框位置,同时又要准确的判断每
论文部分内容阅读
目标检测作为计算机视觉领域中的一个重要研究课题,是识别和定位任务的统一。目标检测的主要目的是定位图像中感兴趣的目标,既要给出目标的边界框位置,同时又要准确的判断每个目标的所属类别并对其进行打分。本文主要对基于卷积神经网络的目标检测算法进行研究,在SSD算法的基础上提出一种可以从零开始学习的目标检测算法,可扩展用于数据库相对匮乏的特殊目标检测领域。本文算法架构主要以利用深度可分离卷积结构改进的密集块结构为主,在尽量减少算法的参数量的同时很好的防止了过拟合。针对如何将低层卷积特征的详细语义信息和高层卷积特征的抽象信息进行融合来提高特征的表现能力,进而提高目标检测算法准确率的问题,本文提出一种融合多层特征图语义信息的预测结构。本文完成软化非极大值抑制方法的实验,分析并证实了该方法不适用于基于回归的目标检测算法,进而确定本文算法仍然采用传统的非极大值抑制方法。本文目标检测算法的深度为116层,宽度为48层,算法的参数量为11.8M,远小于目前应用广泛的目标检测算法Faster R-CNN、R-FCN和SSD,运行时间为50ms,基本满足实时性要求,在PASCALVOC数据集上测试的平均准确率为78.6%,优于Faster R-CNN和SSD,加入MS COCO训练集测试后的平均准确率为81.6%,优于目前准确率最高的R-FCN算法,且本文算法尤其提高了小目标的检测准确率。本文算法可看成一种兼顾检测精度和速度的实时目标检测算法。本文自制3万张有5类学生行为的数据库来验证算法的实用性,本文算法在此数据库上测试的平均准确率为88%,可对实际课堂场景下视频或图片中的学生行为进行分析。
其他文献
搜索式无载体信息隐藏是新近提出的无载体信息隐藏方法的典型思路,该类方法通过检索大数据库来寻找自然无修改载体来表达秘密信息以对抗密写分析的检测。但这类方法存在的问
石油中存在着大量的含硫化合物,在燃烧过程中会生成硫氧化物对环境造成十分严重的影响。石油中存在的噻吩类物质一直是石油脱硫中较难去除的化合物。随着人们对环境保护的意识越来越强,对于石油中硫含量的限制也越来越高。而如何有效地去除噻吩类化合物是石油加工过程的一大难题。氧化脱硫是生产超清洁燃料的最具前景的技术,可以脱除加氢脱硫技术难以去除的苯并噻吩、二苯并噻吩及其衍生物等。而常规的氧化脱硫需使用催化剂来促进
目前,临床上用于骨缺损修复的生物材料主要包括不可降解的金属材料、可吸收的有机高分子材料和生物陶瓷材料等。其中钛合金等生物惰性材料需要二次手术取出,增加了患者的创伤和费用负担,而可降解生物材料力学性能差,无法满足承载部位的骨替换。近年来,生物可降解金属材料逐步发展,其特性能够弥补传统金属材料和可降解生物材料的局限,具有十分广阔的发展前景。本课题主要探索钙磷涂层多孔锌合金支架材料在颅颌面骨缺损修复中的
近年来,人体动作识别已成为计算机视觉领域的重要研究方向,广泛应用于人机交互、视频监控、虚拟现实等领域,对于人工智能发展有重要的推动意义。动作识别在受限的实验环境条
姿控飞轮是轻型敏捷型军用卫星姿控系统的核心部件。近年来,采用低密度、高强度、高模量的碳纤维复合材料进一步改善飞轮的转动惯量-质量比等性能已成为主要趋势。国内卫星姿
随着中国旅游业的快速发展以及国际声望的日益提高,近年来到中国旅游的外国游客越来越多,根据世界旅游组织的评估,中国将在2020年发展成为世界排名第一的旅游目的地国家。入
在人们的生活中存在大量的不平衡数据。研究表明,传统以最大化分类准确率为目标的机器学习算法倾向于将待测试样本划分为多类,而忽视少类的识别率。然而,通常少类样本具有重
天然气储量丰富、容易形成预混合气、颗粒物排放少且抗爆性好的特点使其适合作为汽车代用燃料。由于天然气层流火焰传播速度慢,导致天然气发动机燃烧持续期长,后燃严重,甚至
得益于因特网和计算机软硬件技术的高速发展,以及三维建模技术的日渐成熟,相比于文本和二维图像,三维模型不仅更完整地包含了物体自身的信息,同时也体现了模型的空间信息,相