单阶段目标检测算法研究与运用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:aspiis6sql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,目标检测算法不断推陈出新,检测速度与识别精度都有了很大的提升。单阶段的检测模型形成了一个相对固定的算法框架,但模型本身存在一些缺点和不足。首先,单阶段目标检测模型采用人为设定参数的方法生成检测边框,容易出现检测边框泛化性差的问题,造成模型在不同数据集的模型性能差异很大。同时,模型的检测边框在回归过程中,边框回归损失值并不能很好的反应出边框回归效果的真实好坏。具有相同回归损失值的边框的回归效果经常差异很大,会出现一些边框回归到了合适位置,其他边框还有很远的回归差距的现象。针对上述单阶段目标检测算法目前存在的难点问题,本文旨在改进单阶段目标检测算法的检测边框生成算法和边框回归损失函数,以SSD(Single Shot Detector)检测算法为研究的内容,主要工作如下:(1)本文提出一种新型生成检测边框的TKA算法(Twice k-means algorithm),该算法是对检测边框生成方法进行改进。通过实验发现,基于新型检测边框生成TKA算法的SSD模型对于不同数据集的泛化性更强,有效的提高了模型的鲁棒性和精准性。(2)本文提出一种新的检测边框回归损失函数AIo U算法(Area-Io U loss),该算法基于预测边框和标签边框的重叠面积进行回归损失的改进。通过实验发现,本文提出的AIo U损失函数算法可以提高目标物体的检出率,降低目标物体的误检率和漏检率,极大的提高了模型对待检测物体的召回率和精准率。(3)本文将两种新型改进算法融合到SSD网络模型,并对数据预处理,SSD网络模型架构和模型训练过程进行重构。通过实验发现,基于两种改进策略的SSD模型对于不同数据集的泛化性更强,提高了模型的稳定性和精准性。本文的改进算法主要在VOC数据集和COCO数据集上进行实验精度对比,并通过相关的热力图和边框可视化操作,论证改进的SSD模型具有更高的鲁棒性和泛化性。
其他文献
随着现代科学技术的发展,越来越多的科学与工程领域中的问题需要借助科学计算方法来求解。其中许多问题定义在无界区域上,而传统方法并不能有效地求解此类问题,人工边界方法是过去几十年发展起来的求解此类问题的重要方法之一。本文将人工边界方法应用到一类无界区域上的一维常系数电报方程初边值问题。我们首先引入适当的人工边界将问题限定在有限计算区域,随后利用Laplace变换以及一些基本的应用数学技巧,给出了该问题
当今经济全球化、区域间市场一体化的趋势依然没有改变,国际间投资和贸易的交流与合作依然是世界各国促进经济发展最有效的手段之一。中国始终坚持提升对外开放水平,构建良好营商环境,因此在吸引外商投资方面,就必须坚持包容开放的精神,推动投资自由化,促使外商投资能够在中国市场充分发挥其应有的作用,拉动经济持续增长,推动产业转型升级。建立和完善我国的外商投资国家安全审查是为引进外商投资设立底线,使得即能充分利用
胚胎干细胞有独特的能力,能自我更新,无限增殖,并分化或发育成多种类型的细胞和组织。胚胎干细胞应用到临床领域的关键问题是如何从其他类型的细胞中鉴定和分离出ES细胞。作为细胞的“身份证”,特异标志分子在胚胎干细胞识别和确定中发挥了重要作用。本论文中将从噬菌体肽库中筛选出的针对猕猴胚胎干细胞的特异多肽的DNA序列连接到pGEX-KG表达载体上,以便获得GST-peptides融合蛋白。同时,抽提大量培养
1906年1月,李叔同在日本编辑出版了综合性期刊《音乐小杂志》作为中国近代音乐期刊的起步,截至目前我国的音乐期刊发展道路已走过115年。1949年新中国的成立,使我国的社会制度发生了较大变革,文化思潮也随着社会环境的改变有了新的发展方向。上海作为当时国内现代化的城市,奥斯邦将中国第一座广播电台建立在上海并开始播音,这注定上海是近代中国广播事业最发达的城市。《广播歌选》作为曲谱类期刊,以广播为载体,
随着信息技术的发展和人们对生活便利性的追求,大量依靠生物特征构建的识别系统正在逐步取代传统的密钥验证,其中声纹具有特定性和相对稳定性的生物特征,在越来越多的认证系统中被使用。而随着语音合成技术的发展,使得人们可以利用计算机生成与自然人说话语音十分类似的合成语音,这一技术在提高自动语音应答服务质量的同时,也给基于声纹识别的说话人认证系统的安全性带来挑战。犯罪分子可以轻易的获取用户的个人语音信息,通过
在知识表示领域,数据稀疏性是大规模知识图谱普遍需要解决的难题。对此,研究者建立了一个连续的向量空间,将知识图谱三元组进行向量化嵌入到其中,从而实现了对实体和关系的分布式表示。现有模型在训练过程中采用生成负样本的方法主要是随机采样,通过此方法生成的大多数负样本质量较差,对于知识表示的健壮性增强并不明显。本文在现有的面向知识图谱的表示学习相关原理和技术的基础上,将现有知识表示模型结合到生成对抗网络中提
随着经济的发展,物流运输活动在社会经济活动中的作用也日益提升。企业采购,居民家庭的牛奶、报纸运输,邮递服务,城市垃圾的回收等生产、服务活动都将我们的生活和物流运输紧密联系在一起。另一方面,在现实生活中,物流运输活动常常会遇到各种不确定因素,例如天气变化、交通拥堵、不确定的需求和服务时间等等,均给物流运输管理带来了极大的挑战。本文以物流运输中的车辆路径问题为研究背景,考虑带有随机顾客需求的情况,建立
文本验证码出现早,可扩展性强,被广泛使用。然而,随着深度学习技术的发展,文本验证码的安全性受到越来越大的挑战。因此,为增强文本验证码面对深度学习模型时的反识别能力,论文提出两类适用于不同场景的基于深度学习的文本验证码反识别算法,这两类算法能在不影响人眼识别成功率的前提下最大化提升原有文本验证码的反识别能力。第一,研究计算资源受限情况下如何尽可能提升文本验证码反识别能力的问题。深度神经网络对对抗样本
智能交通系统中,道路运动障碍物的检测跟踪一直都是一个重点的研究内容。由于行车过程中车载摄像头运动导致背景运动,使得视频中存在运动的障碍物与背景两个相互独立的运动导致目标检测和后续跟踪困难。对于在汽车辅助驾驶系统中,道路上运动障碍目标的检测时由于车载摄像头运动引起的背景复杂以及对检测跟踪结果的实时性准确性等技术要求,提出一种有效的解决方案。该论文主要工作有:(1)目标检测问题上,将视频图片帧进行感兴
胚胎干细胞是从胚胎发育早期的囊胚的内细胞团内分离出来的一类细胞。胚胎干细胞的基本特性是能够自我更新和具有全能性。自我更新是指在特定的培养条件下,胚胎干细胞具有无限增殖的能力。全能性是指其能分化为体内源自三个胚层的所有类型的细胞。它的这些基本特征使其在理论研究以及人类疾病的治疗方面具有多种重要应用。研究表明,在胚胎干细胞表面存在特异的分子,可以作为胚胎干细胞分离、鉴定以及纯化的标志物。然而,目前已经