【摘 要】
:
为提升大坝安全运维的效率,大坝缺陷目标检测模型有助于辅助巡检人员进行缺陷检测。大坝缺陷几何形状多变,而采用传统卷积方式进行特征提取的单点多盒检测器(SSD)模型无法适应缺陷的几何变换。针对上述问题,提出可变形卷积单步多框检测器(DFSSD)模型。首先将原始SSD的主干网络VGG16中的标准卷积替换为可变形卷积,用于处理缺陷的几何变换,并且通过学习卷积偏移量来提升模型的空间信息建模能力;其次针对不同
【机 构】
:
河海大学计算机与信息学院,华能澜沧江水电股份有限公司,中国电建集团昆明勘测设计研究院有限公司
【基金项目】
:
国家重点研发计划项目(2018YFC0407105),华能集团总部科技项目(HNKJ19-H12),国网新源科技项目(SGTYHT/19-JS-217)。
论文部分内容阅读
为提升大坝安全运维的效率,大坝缺陷目标检测模型有助于辅助巡检人员进行缺陷检测。大坝缺陷几何形状多变,而采用传统卷积方式进行特征提取的单点多盒检测器(SSD)模型无法适应缺陷的几何变换。针对上述问题,提出可变形卷积单步多框检测器(DFSSD)模型。首先将原始SSD的主干网络VGG16中的标准卷积替换为可变形卷积,用于处理缺陷的几何变换,并且通过学习卷积偏移量来提升模型的空间信息建模能力;其次针对不同特征的尺寸,改进先验框比例,从而提高模型对条形特征的检测精度与模型的泛化能力;最后为解决训练集正负样本不
其他文献
在大规模城市环境下,因为光照变化、摄像机拍摄角度变化、存在大量移动物体、地表外观变化,使得视觉位置识别变得尤为困难。针对该问题提出一种基于SENet改进的ResNet的视觉位置识别方法PlaceNet。在自建百万级街景数据集上进行训练,在自建数据集和SL数据集上进行测试。结果表明PlaceNet精确度和查询效率比NetVLAD更高。
针对传统模糊C均值(FCM)聚类算法在处理噪声图像时易受到噪声影响的问题,提出了基于FCM的小波域特征增强的噪声图像分割方法。首先,将噪声图像进行二维小波分解;其次,对近似系数进行边缘增强,同时利用人工蜂群(ABC)优化算法对细节系数进行阈值处理,并将处理后的系数进行小波重构;最后,对重构后的图片使用FCM算法来进行图像分割。选取5幅典型的灰度图像,分别添加高斯噪声和椒盐噪声,使用多种方法进行分割
针对准单应变换图像拼接算法造成图像非重叠区域存在纵向投影失真的问题,提出了一种基于非线性约束的图像拼接算法。首先,该算法利用非线性约束来平滑过渡分界线左右的图像区域;然后,利用抛物线方程替换准单应变换的直线方程;最后,利用网格化的方法提高图像纹理映射的速度,并利用基于最佳缝合线的方法融合图像。对于尺寸为1 200像素×1 600像素的图像,所提算法的纹理映射耗时波动范围为4~7 s,并且其斜线结构
针对支持向量数据描述(SVDD)对惩罚参数相当敏感的问题,提出一种新颖的异常检测方法,称为分布熵惩罚的支持向量数据描述(DEP-SVDD)。首先,将正常样本作为数据的全局分布,并在高斯核空间中定义每个样本点与正常样本分布中心的距离度量;然后,基于该距离设计评估样本点属于正常或异常样本的概率;最后,利用此概率构造基于分布熵的惩罚度以对相应的样本进行惩罚。在9个真实数据集上,将所提方法与SVDD、密度
车牌定位是车辆信息识别中的关键和基础。为解决在复杂无约束场景下存在的车牌定位精度不高,噪点和干扰因素较强等问题,提出一种基于最大稳定极值区域和卷积神经网络的车牌精准定位新方法。利用最大稳定极值区域找出车辆图像中二值化参数较为稳定的子图像区域;根据车牌的先验知识,滤掉明显不符合车牌字符特征的子图像区域;对保留下的子图像进行相应的启发式搜索和卷积神经网络识别,找出确切的多个车牌字符位置;通过滑动窗口和
针对现有的图匹配方法没有考虑到社交背景下的多种约束以及在多约束图匹配中图结构的变化,提出一种多约束图模式匹配方法。为了提高多约束图模式匹配的效率,提出强社交图的概念及一种强社交图的索引结构来索引图的可达性、图模式和上下文背景信息,提出维护强社交图索引的算法INC-SSG和多约束图匹配的增量算法SSG-IncMGPM,当面对强社交图结构的变化时能快速有效地识别多约束图模式匹配结果。通过对五个真实社交
随着互联网技术和共享经济模式的快速发展,作为一种新型的群体计算模式,近年来众包(Crowdsourcing)已经得到了广泛的应用并成为研究热点。针对众包应用的特点,为确保众包任务的完成质量,现有研究从工作者能力评估的角度出发已提出了各种不同的众包任务分配方法。首先介绍了众包的概念和分类,阐述了众包平台的工作流程及其任务特点,并在此基础上总结了现有的工作者能力评估的相关研究工作;然后从基于匹配、基于
针对传统的密码锁存在安全性低、稳定性差等问题,提出一种基于FPGA的密码锁的设计方法,以现场可编程逻辑器件为载体,并采用Verilog HDL硬件描述语言,实现密码锁的解锁、修改密码、报警提示和数码管显示功能。密码锁系统主要由按键输入模块、按键消抖模块、分频模块、密码检测模块、输出控制模块、译码显示模块组成。利用Quartus Ⅱ 13.0和Modelsim 10.4软件对各模块进行综合和仿真验证
柔性作业车间调度问题(FJSP)是一类应用广泛的组合优化问题。针对多目标FJSP求解过程复杂、算法易陷入局部最优的问题,提出了一种基于多区域采样策略的混合粒子群优化算法(HPSO-MRS),以同时优化最大完工时间和总机器延迟时间这两个目标。多区域采样策略能够区分粒子所在Pareto前沿面的位置,根据不同区域进行采样重组,并为采样后位于Pareto前沿面多个区域的粒子规划相应的运动方向,从而有针对性
针对水工隧洞缺陷识别任务中现有深度卷积神经网络(DCNN)对缺陷图像特征提取能力不足、识别种类少、推理耗时长的问题,提出一种基于动态特征蒸馏的缺陷自主识别方法。首先,通过深度曲线估计网络对图像进行优化,从而改善低照度环境下的图像质量;其次,构建加入注意力机制的动态卷积模块取代传统静态卷积,并且把得到的动态特征用于训练教师网络以获得更好的模型特征提取能力;最后,在知识蒸馏框架中融合鉴别器结构,以构造