【摘 要】
:
针对金属表面缺陷检测中目标尺寸小和特征不清晰导致漏检的问题,提出一种改进YOLOv3的金属缺陷检测算法。在YOLOv3网络结构的基础上,将第11层浅层特征与网络深层特征融合,生成一个新的尺度为104×104特征图层,提取更多小缺陷目标特征。加入DIo U边框回归损失,为边界框提供移动方向以及更准确的位置信息,加快模型收敛。利用K-Means++聚类分析数据集上的先验框尺寸信息,筛选出最优的Anch
【基金项目】
:
国家自然科学基金(1806087),江苏省研究生创新项目(SJCX20_1475)。
论文部分内容阅读
针对金属表面缺陷检测中目标尺寸小和特征不清晰导致漏检的问题,提出一种改进YOLOv3的金属缺陷检测算法。在YOLOv3网络结构的基础上,将第11层浅层特征与网络深层特征融合,生成一个新的尺度为104×104特征图层,提取更多小缺陷目标特征。加入DIo U边框回归损失,为边界框提供移动方向以及更准确的位置信息,加快模型收敛。利用K-Means++聚类分析数据集上的先验框尺寸信息,筛选出最优的Anchor Box,使定位更加精准,降低网络损失。将改进后的算法与其他检测算法在NEU-DET数据集上进行检测
其他文献
近年来,深度学习被广泛应用于文本情感分析。其中文本卷积神经网络(TextCNN)最具代表性,但是TxetCNN的语义特征提取存在词嵌入维度语义特征丢失、最大池化算法特征提取不足和文本长期依赖关系丢失的问题。针对以上问题,提出多特征混合模型(BiLSTM-MFCNN)的文本情感分析方法。该方法使用双向长短记忆网络(BiLSTM)学习文本的长期依赖关系;改进TextCNN的卷积层和池化层提出多特征卷积神经网络(MFCNN),卷积层利用五种不同的卷积算法,分别从句子维度、整个词嵌入维度、单个词嵌入维度、相邻词向
深度神经网络在有着大量标注数据的图像识别任务上已经占据了统治地位,但是在只有少量标注数据的数据集上训练一个好的网络仍然是一个据有挑战性的任务。如何从有限的标注数据中学习已经成为了一个有着很多应用场景的热点问题。目前有很多解决小样本分类任务的方法,但是仍然存在识别准确率低的问题,根本原因是在小样本学习中,神经网络只能接收少量有标签的数据,导致神经网络不能获取足够的用来识别的信息。因此,提出了一种基于
越来越多的行业开始利用云以降低成本提高生产力,支撑多样化的服务对数据中心的网络性能提出了更高的要求,如何高负载下优先保证各项服务的质量变得至关重要,云服务提供商同时也关注如何提高数据中心的网络资源利用率并降低能耗。结合上述问题,提出一种基于服务满足度对非服务网络流进行调度的方法。引入服务满足度这一概念,评估网络状态能否满足服务需要,然后依据网络流所支撑的不同服务将其分类,网络负载激增时基于服务满足度调整非用户服务依赖的网络流,降低网络负载缓解拥塞。仿真结果表明,主动避让方法在网络高负载时能优先保证服务的质
“5·12”汶川大地震已经过去整整10年。在这10年间,我国的经济水平不断提高,国力日益增强,科技水平得到了极大的发展,一系列抗震救灾的先进技术和设备不断涌现。 全球领先的地震预警系统 一直以来,地震预报是世界性的未解难题。地震预警不是预报,而是在地震发生后,利用地震波与电波在传播速度上的差异来打时间差。 “ICL地震预警技术系统”(以下简称ICL)是我国首个通过科技成果鉴定的地震预警技术系
为了提高人脸表情识别的准确率和加快处理速度,提出了一种基于优化剪枝GoogLeNet的人脸表情识别方法。利用GoogLeNet网络提取面部特征,其中Inception模块加深学习深度,并利用典型的分类器实现人脸表情分类。改进GoogLeNet网络,添加全局最大池化层并保留检测目标的位置信息,以Sigmoid交叉熵作为训练目标,获得全面的人脸表情特征信息。通过剪枝算法对GoogLeNet网络进行训练
图像语义分割是图像识别中的一个经典难题,是机器视觉研究的一个热点。但在实际应用中,会出现语义标签预测不准确、所分割对象与背景之间边缘信息损失问题,这已逐渐成为了图像理解的瓶颈。据此,提出了一种基于金字塔场景分析网络(PSPNet)的网络改进结构,在特征学习模块中将输入图在原残差网络(ResNet)的基础上通过在网络内部增加卷积、池化操作,进一步学习各个层次特征,将所学习到的多个低层次特征图与高层次
知识推理是解决知识图谱中知识缺失问题的重要方法,针对大规模知识图谱中知识推理方法仍存在可解释性差、推理准确率和效率偏低的问题,提出了一种将知识表示和深度强化学习相结合的方法RLPTransE。利用知识表示学习方法,将知识图谱映射到含有三元组语义信息的向量空间中,并在该空间中建立强化学习环境。通过单步择优策略网络和多步推理策略网络的训练,使强化学习智能体在与环境交互过程中,高效挖掘推理规则进而完成推理。在公开数据集上的实验结果表明,相比于其他先进方法,该方法在大规模数据集推理任务中取得更好的表现。
针对目前表情识别准确率偏低,表情数据集中类别样本类间差异小、类内差异大以及误标注样本产生的误分类等问题,提出了一种结合改进VGGNet和Focal Loss的人脸表情识别算法。在迁移学习的基础上,通过设计新的输出模块对VGGNet模型进行改进,提升了模型的特征提取能力,能够较好地避免过拟合现象;通过设置概率阈值对Focal Loss进行改进,避免误标注样本对模型分类性能产生影响。实验结果表明,该模
在带钢的生产过程中可能会因为生产工艺的问题导致带钢表面出现缺陷,传统的带钢表面检测方法存在检测速度慢、检测精度低等问题。在计算机深度学习快速发展的今天,为实现带钢表面缺陷快速有效的检测,提出改进的掩码区域卷积神经网络(Mask R-CNN)算法,使用k-means II聚类算法改进区域建议网络(RPN)锚框生成方法;同时调整Mask R-CNN模型的网络结构,去掉掩码分支,提高了模型的缺陷检测速度
为了解决LBP算法抽取的纹理特征仅考虑了邻域像素的特征,忽略关键的局部和全局特征的问题,提出一种基于改进型LBP算法的WCM-LBP植物叶片图像特征提取方法。该算法融合了加权局部均值算法WRM-LBP和加权全局均值算法WOM-LBP,通过提取叶片基于区域的关键几何特征和纹理特征对LBP特征描述符进行加权改造,并采用加权局部均值和加权全局均值代替传统的中心像素点,最后将叶片图像的R、G和B通道颜色分