基于深度学习的图像目标检测算法的研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:mishier
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测涉及的理论基础比较广泛,包含模式识别、人工智能、图像处理等,在许多领域都有大量的应用,比如:视频监控、人机交互等等。随着深度学习的兴起,在目标检测中引入了深度学习模块,使算法在复杂场景下也可以稳定发挥效果。深度神经网络通过多层的网络对目标对象的特征进行提取,将待测图像的特征逐层次的从浅层网络抽象到深层网络,提取到的信息更加全面,检测效果更好。本文研究了深度学习和其在目标检测领域的应用,并在YOLOv3模型的基础上做出如下改进:首先,YOLOv3模型利用经典的K-means聚类算法确定锚点位置,但是,该算法在选取锚点初始位置是随机的,会造成偶然性大从而影响聚类结果。针对这一点本文提出一种改进的基于抽样的核K-means聚类算法,在经典的K-means聚类算法基础上结合核函数与抽样,用于确定anchor的初始位置。基于MNIST的实验表明,改进算法的聚类效果由94.72%增长到95.58%,初始锚点位置的确定更加准确。然后,为了使YOLOv3模型对小目标更加敏感,提出一种结合了inception结构的深度卷积神经网络。Dark_inception网络利用inception结构替换掉DarkNet-53中的卷积层;Dark53_inception网络是在YOLOv3模型的多尺度融合后添加inception结构。这两种模型拓宽了网络的宽度,也减少了参数的计算量。基于数据集VOC 2007的实验结果表明,改进后网络相较于未改进网络的mAP分别增长了1.76与2.07倍,改进后的网络检测精度有了一定程度提高。最后,本文针对YOLOv3模型对小目标识别不精确的缺点,提出在基础模型和改进模型的三个尺度融合的基础上,增加一个尺度,并增加三个anchor数量,考虑浅层网络提取到的特征。实验证明,改进后的网络比未改进网络预测框的定位更加精确,准确率提升了1.54倍。
其他文献
在今天这个版本之前,大陆能买到这本书的地方大概不超过5个,想读或者会对它一见钟情的,大概会超过5万或更多,包括广告人、书店店主、出版业者、时尚体验者、文化阅读者、书的
期刊
卧式蒸汽发生器是WWER机组一回路重要设备之一,蒸汽发生器(SG)在使用过程中会产生腐蚀,影响到设备使用寿命.在分析欧盟VERLIFE标准基础上,结合美国ASME、英国BS7910等标准,提出
当前,我国工业自动化已进入成熟阶段,作为工业领域应用的重要工具,3D视觉在工业领域的应用极为广阔,在强大的市场需求驱动力下,机器视觉也迎来了发展的春天!前段时间国内备受
作为以文化形态表现出的军事软实力,军事文化软实力是以文化形态表现出的军事实力,是一个国家或地区通过对其拥有的无形和有形的军事文化资源进行整合、动员和使用,将其转化
“我希望过上大约一百年以后醒过来,至少让我用一只眼睛,瞧一下科学成了什么样子才好。”这是契诃夫在短篇小说《没有意思的故事》中为老教授写下的内心独白。“小说家”的头衔
报纸
()$$  如图所示,搅拌摩擦焊接过程中,一根特型指棒作为焊接工具(俗称为“搅拌头”)旋转插入待焊接位置,略为停留后沿着既定焊接轨迹(编程实现)前进,直至焊接完成后抬起并离开零件表
报纸
亚历山大·绥拉菲莫维奇(1863—1949)是苏联杰出的无产阶级作家,原姓波波夫,一生创作了三部长篇小说、许多中短篇小说和特写。他是高尔基的好友。列宁对他很尊重,1920年曾给
改革开放三十年来,外商投资企业在我国越来越多,各种投资、合作、经营活动日趋活跃。由于社会经济生活的纷繁复杂以及外商投资企业的迅速发展,涉及外商投资企业的纠纷也日益
赵匡胤惩治贪官不手软武勤宋太祖赵匡胤为了稳住大宋江山,在位期间几乎年年反贪污、杀贪官,其中文官杀到了御史,武官杀到了将军。就在他临死前的两个月──开宝九年八月,还杀掉了
近年来,随着信息存储产业的蓬勃发展,具有功耗低、读写速度快、集成密度高等特点的非易失性存储器被广泛地研究。其中,具有“三明治”简单结构的阻变存储器被认为最有可能成