【摘 要】
:
金属表面缺陷检测是工业生产质量把控的重要一环。在复杂的工业场景中,传统的图像处理方法无法有效地检测缺陷区域,而人工检测既费时又费力。快速有效地检测金属表面缺陷已成为提高生产效率的关键。复杂的光照条件会使金属表面产生强反射和倒影,缺陷种类多样、边界模糊,给缺陷检测问题带来巨大的挑战。提出了一种基于注意力机制的级联网络缺陷检测算法(R-CNN),对金属表面缺陷进行高质量分类和定位。设计了一个轻量级的网
【机 构】
:
南京航空航天大学计算机学院,模式分析与机器智能工业和信息化部重点实验室,软件新技术与产业化协同创新中心
【基金项目】
:
国家自然科学基金(61976115,61672280,61732006),南航人工智能+项目(56XZA18009)。
论文部分内容阅读
金属表面缺陷检测是工业生产质量把控的重要一环。在复杂的工业场景中,传统的图像处理方法无法有效地检测缺陷区域,而人工检测既费时又费力。快速有效地检测金属表面缺陷已成为提高生产效率的关键。复杂的光照条件会使金属表面产生强反射和倒影,缺陷种类多样、边界模糊,给缺陷检测问题带来巨大的挑战。提出了一种基于注意力机制的级联网络缺陷检测算法(R-CNN),对金属表面缺陷进行高质量分类和定位。设计了一个轻量级的网络模块,该模块沿着空间和通道计算注意力,将其插入到卷积神经网络中可有效提高特征提取能力;为了提高检测精度
其他文献
K最近邻(KNN)算法作为目前使用最广泛的有监督分类算法,在大规模、多维度数据的处理方面往往是低效的,因此提出了一种适用于高维度大数据量处理的改进KNN算法.首先采用深度神
为了能够更好地预测股票的走向趋势,解决在大量特征和大数据下预测精度低的问题,在随机森林的基础上提出了一种基于Pearson系数的随机森林新的组合模型方法。利用Pearson系数进行相关性检验删除无关特征;使用改进的网格搜索法对决策树参数调优;利用随机森林将剩余特征进行建模回归预测,并得出最终结论。实验结果表明:改进后的随机森林在预测值的平均绝对误差(MAE)、均方误差(MSE)都得到了较大的提高。其中今世缘改进后的随机森林比传统随机森林的MSE值降低了56%,MAE值降低了37.3%,其他两只股票预测效果
为了追求精度,深度学习模型框架的结构越来越复杂,网络越来越深。参数量的增加意味着训练模型需要更多的数据。然而人工标注数据的成本是高昂的,且受客观原因所限,实际应用时可能难以获得特定领域的数据,数据不足问题非常常见。数据增强通过人为地生成新的数据增加数据量来缓解这一问题。数据增强方法在计算机视觉领域大放异彩,让人们开始关注类似方法能否应用在序列数据上。除了翻转、裁剪等在时间域进行增强的方法外,也描述
下雨是一种常见的天气现象,而滞留在图像上的雨条纹降低了图像的清晰度以及影响了基于该图像的后续图像处理。从图像中去除雨的关键是如何准确、鲁棒地识别图像中的雨区域。使用导向滤波器和Haar小波变换组成的雨线提取模块来增强雨条纹特征提取,然后通过空间关注模块生成雨线注意力图,以准确定位雨条纹的位置。两者结合后,获得降雨条纹的前景信息再通过生成对抗网络训练机制中相互博弈的特征,可以增强雨条位置识别能力,并
情感分析是指利用计算机自动分析确定人们所要表达的情感,其在人机交互和刑侦破案等领域都能发挥重大作用。深度学习和传统特征提取算法的进步为利用多种模态进行情感分析提供了条件。结合多种模态进行情感分析可以弥补单模态情感分析的不稳定性以及局限性等缺点,能够有效提高准确度。近年来,研究者多用面部表情信息、文本信息以及语音信息三种模态进行情感分析。主要从这三种模态对多模态情感分析技术进行综述:首先对多模态情感分析的基本概念以及研究现状进行简要介绍;其次总结了常用的多模态情感分析数据集;然后分别对现有的基于面部表情信息
近年来,国家电网积极推动泛在电力物联网的建设,以实现电力系统的万物互联与优化管理。其中,射频识别技术(RFID)作为泛在电力物联网建设的核心技术,凭其价格低廉、无需电源、非视距通信、远距离通信等特点,被广泛应用于电力仓储物资管理、电力巡检等应用场景。为了盘点电力设备仓库中的物品,需要快速识别粘贴在物品上的标签,然而由于仓库中存在大量标签,在通信过程中容易产生标签信号冲突。针对当前商用RFID系统普
基于深度学习网络在医学图像分割方面取得了很多成果。由于类圆形的肺结节不同于血管和大部分肺部结构呈扁平状,因此通过对U-Net进行扩展,提出一种带有多视图密集卷积的双向LSTM U-Net网络来消除血管和肺内组织结构以检测结节。与U-Net在跳跃连接中进行级联不同,改进双向LSTM网络将编码路径中提取特征图与解码卷积层进行非线性结合。为了加强特征传播和鼓励特征复用,在编码路径的最后一个卷积层采用密集
提出了一种基于随机特征映射的四层神经网络(FRMFNN)及其增量学习算法。FRMFNN首先把原始输入特征通过特定的随机映射算法转化为随机映射特征存储于第一层隐藏层节点中,再经过激活函数对随机映射特征进行非线性转化生成第二层隐藏节点,最后将第二层隐藏层通过输出权重连接到输出层。由于第一层和第二层隐藏层的权重是根据任意连续采样分布概率随机生成的而不需要训练更新,且输出层的权重可以用岭回归算法快速求解,从而避免了传统反向传播神经网络耗时的训练过程。当FRMFNN没有达到期望精度时,借助于快速的增量算法可以持续改
随着知识图谱技术的兴起,利用金融事件大数据中的实体关系来构建金融事件的精准画像成为一个重要的研究方向。通过对金融事件大数据信息进行精准画像,人们可以详细分析金融事件大数据中的属性关系,全面了解金融事件的发展态势,从而分析金融市场发展趋势与规律。然而金融事件大数据存在文本数据噪音多、中文语义复杂以及实体关系抽取不准确等研究难点,导致金融事件大数据画像不精准。针对以上问题,提出一种基于多重注意力的金融事件大数据实体关系抽取算法(REMA)来进行实体关系的抽取,然后利用抽取的实体关系信息结合知识图谱技术进行金融
在短语音环境下,总变率空间对语音概率分布估计不足,导致说话人识别性能下降。针对上述问题,提出一种基于总变率空间和时延神经网络(TDNN)的增强说话人身份向量的方法。目的是学习总变率空间和时延神经网络的线性相关性,同时提取说话人嵌入向量并投影在新的空间上,组合成新的说话人超向量来增强说话人信息。训练阶段,分别训练总变率空间和时延神经网络,重新组建一个无关说话人集,从中提取身份向量和x向量并在典型关联分析(CCA)下得到投影矩阵;注册和测试阶段,抽取注册和测试说话人的嵌入向量,通过投影矩阵映射在新空间中,然后