【摘 要】
:
针对现有基于深度学习的通用目标检测方法对机场场面环境目标尺度差别大,特别是小目标难以检测到的问题,提出了一个基于SSD算法并结合特征金字塔融合网络的多尺度目标检测算法。该算法首先采用了更深的ResNet-50作为骨干网络,并单独设计了六层额外特征层。其次,使用特征金字塔网络进行特征融合,以获得更鲁棒的语义信息。最后使用Soft-NMS以解决存在的漏检情况,调整先验框的尺度比以更好的检测小目标。通过
论文部分内容阅读
针对现有基于深度学习的通用目标检测方法对机场场面环境目标尺度差别大,特别是小目标难以检测到的问题,提出了一个基于SSD算法并结合特征金字塔融合网络的多尺度目标检测算法。该算法首先采用了更深的ResNet-50作为骨干网络,并单独设计了六层额外特征层。其次,使用特征金字塔网络进行特征融合,以获得更鲁棒的语义信息。最后使用Soft-NMS以解决存在的漏检情况,调整先验框的尺度比以更好的检测小目标。通过在机场场面数据集实验表明,该改进算法能够在推断速度为32FPS的情况下,取得86.31%的mAP,对比其
其他文献
为揭示温度对大叶藻(Zostera marina)生长、叶绿素荧光参数及其光合色素含量的影响规律,设置了10 ℃、15 ℃、20 ℃、25 ℃、30℃等5个处理组,以分析大叶藻在不同温度条件下的生长指标(鲜重、叶片数、叶长、根数和根长)、叶绿素荧光参数(Fv/Fm、Y(ll)、qP、NPQ)及其光合色素(叶绿素a、叶绿素b、叶绿素总量及类胡萝卜素)含量的变化。结果显示:(1)大叶藻的各生长指标在1
针对拆回旧智能电能表的回收分类存在人工检定准确率不高、效率低下的问题,提出了一种基于机器视觉的参数信息检测方法,通过检测智能电能表的额定参数信息,完成电能表的分类回收工作。在以C# 与Halcon为软件平台建立智能电能表图像检测系统的基础上,采用Blob分析算法,对图像进行ROI(感兴趣区域)提取,采用直方图均衡化对提取后的图像进行处理,以增强背景与目标区域之间的对比度,获取质量较高的电能表图片,
水翁[Cleistocalyx operculatus (Roxb.) Merr.]是具有重要经济价值的耐水淹陆生植物。以盆栽水翁幼苗为实验材料,通过叶片喷施外源生长激素吲哚乙酸(IAA)、胁迫激素脱落酸(ABA),或在水中添加IAA、ABA两种不同处理模式下,比较研究外源IAA、ABA调控水翁水淹(土壤表层以上10 cm)胁迫耐受性差异。结果表明:经历120 d的水淹植株存活率为100%,但水淹
目的 机场道面裂缝、角隅断裂、接缝破碎、修补等病害宽度狭小、长短不一、图像中像素占比少,呈细带状结构,且与复杂背景对比度低,现有检测算法效果不佳。针对以上问题,本文提出了一种基于注意力机制与特征融合的深度神经网络模型DetMSPNet。方法 首先利用注意力机制模块CBAM,使得特征学习更加专注于细带状结构病害区域,抑制干扰信息;接着构建残差空洞金字塔模块,提取不同尺度空间下的特征信息;然后设计最大
为了研究零售商存在资金约束和库存错放时,供应链成员采用无线射频识别(Radio Frequency Identification,RFID)技术及融资决策的均衡问题,本文以单制造商和单资金约束零售商组成的两级供应链为研究对象,基于报童模型构建了供应链成员采用RFID技术前后零售商是否融资四种情景下的收益模型,求解出相应的最优解并探讨了供应链成员RFID采用决策与零售商的融资策略.研究发现:当零售商
针对枪支种属识别目前主要依靠检验人员经验,识别效率较低的问题,本文提出了一种基于多任务级联深度残差网络的枪支图像自动识别模型。该模型以ResNet18为基本构建单元,通过级联融合四个任务(ResNet18单元)中的Softmax损失函数约束,实现对枪支图像从枪族大类到细分枪型的多维度聚类。并在该模型的基础上,设计了一套制式枪支图像智能检索系统,实现了对拍摄上传的枪支图像自动识别其枪支种属信息。在本
针对SSD算法进行车辆检测时存在的漏检问题,提出了一种改进SSD算法。为了提取更多的车辆特征信息,提出新的改进Inception模块,并将其替代SSD网络中的Conv8、Conv9和Conv10层;针对小目标车辆识别率低的问题,将浅层特征的位置信息和深层特征的语义信息进行均衡化融合,设计了多尺度特征融合均衡化网络;为提高模型性能,在特征提取层均引入SENet,对不同特征通道的重要性进行重标定。实验
针对工厂生产线上的商品包装外箱文本印刷存在残缺,无法及时检出影响流通销售的问题,本文制作了工业商品外观信息数据集,提出了基于深度学习的工业视觉箱体字符识别与判断方法。通过对YOLOv3进行合并卷积层与批量归一化层,引入GIoU作为边界框损失函数,设计自适应调整定位坐标方法,优化了在原始图像上进行文本检测定位的速度与精度;训练并对比了CRNN和Tesseract两种识别引擎在裁剪后文本图片上的识别性
在图像拼接篡改检测任务中,由于篡改区域的尺度多样性以及模糊操作的干扰,传统的分类网络难以提取图像的篡改特征。为了有效解决这一问题,提出了基于DeepLab v3+的多任务图像拼接篡改检测算法。首先,使用浅层图像特征来预测图像的篡改区域边界,提高了模型对于篡改边界的敏感性。其次,在空洞空间金字塔模块中融合空间和通道注意力机制,加强了模型对于多尺度篡改区域的适应性。最后使用多尺度的融合特征进行图像的篡
偏头痛是一种严重危害人类健康的脑疾病,其中无先兆偏头痛在临床中占比最多且诊断困难。当前无先兆偏头痛辅助诊断算法研究中,基于机器学习的脑影像功能连接分析方法是最主要研究方向。因此类方法多依赖于预定义的脑图谱模板,受模板选择主观因素及分类器性能影响,现有方法的智能化程度和准确率较低,难以满足临床及研究需求。基于设计的新型3D-CNN技术,提出了一种无先兆偏头痛智能辅助诊断算法—MwoA3D-Net(3