基于U-Net变体网络的混凝土裂缝检测研究

来源 :常州大学 | 被引量 : 0次 | 上传用户:zhangjiakou00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国公共基础设施的快速发展,混凝土作为建筑物的基本原材料被广泛使用,裂缝作为混凝土设施最为常见的结构性病害成为建筑工程质量中健康检测的重要一环。传统的检测方法,如人工检测,存在检测效率低、检测结果不准等问题;基于数字图像处理技术的检测算法,存在需要人工设计特征、模型稳定性差、易受环境干扰等局限。基于此,本文着力于研究基于计算机视觉的智能裂缝检测算法。本文选用具有编码器-解码器以及跳跃连接结构的U-Net作为主体网络,进行针对性研究。主要研究内容如下:(1)针对现有裂缝检测方法在裂缝拓扑结构复杂,前后景像素不协调情况下产生的检测精度低的问题,提出一种基于空洞卷积与动态核融合池化的裂缝检测方法。模型以U-Net网络为基础,编码器阶段插入空洞卷积,能够更大限度的保留裂缝细节与结构信息;解码器阶段引入动态核融合池化模块,用以在并行卷积流中更高效的获得不同尺寸的裂缝语义信息并融合,能够提升细小裂缝的检测效果。实验结果表明,模型有效提升了裂缝检测的精度,减少了漏检、误检现象。(2)本文在(1)的基础上,针对模型结构复杂、参数量大的问题,提出了一种基于结构重参数化与注意力机制的检测模型。首先,模型采用结构重参数化的思想,将编码器端的多分支结构转换成单分支结构用以提取特征,既能保留更高精度的检测结果又能简化网络结构;同时为了更有效的识别裂缝,加入了注意力机制,用以加大提取裂缝特征的前景权重;最后将解码器端的反卷积替换成更轻量、有效的亚像素卷积。实验结果表明,构建的网络模型相较主流的U-Net变体网络模型,参数量、计算量更低且检测精度高、效果好。本文主要基于U-Net网络进行裂缝检测研究。提出的两种检测模型利用优化特征提取以及特征还原等方法,有效改善常规裂缝检测方法中存在的检测精度低、网络模型复杂度高等问题。
其他文献
随着人工智能的快速发展,深度学习技术已经在各个领域中得到广泛应用,包括目标检测、机器翻译、语音识别等。随着研究的深入,将文本、图像和语音等多领域信息进行融合和交互的多模态任务已经引起研究者们的广泛兴趣。其中,视觉问答是多模态学习任务的研究热点之一。视觉问答系统的主要目标是根据图像内容和对应的问题以回答出正确的答案,需解决的问题涉及计算机视觉和自然语言处理等领域。现阶段对于视觉问答的图像表示常采用深
学位
近年来,中国人口老龄化日趋严重,居家养老逐渐成为常态,独居老人日渐增多。跌倒作为居家老人受到意外伤害的主要方式之一,如若跌倒后得不到及时救助,轻则造成身心伤害,重则危及生命。因此,及时有效地检测居家老人的跌倒情况,具有较大的研究价值和社会意义,逐渐成为研究热点。随着居家监控设备的普及,计算机视觉方法跌倒检测已成为研究重点。论文主要工作如下:针对现有ViBe前景提取算法的鬼影问题,提出了一种融合帧间
学位
河流是人类的主要水源之一,对人类的生产生活有着重要意义。溶解氧是河流水质的主要组成部分,也是衡量水质的重要指标之一。利用历史水质数据,准确预测出河流未来一段时间内的溶解氧浓度,对环境政策制定,完善河流水质管理具有重要的现实意义。目前河流溶解氧预测模型的特征多为人工提取,缺乏特征组合全局搜索能力,针对这一问题,提出一种提升溶解氧预测精度的特征选择方法。首先,使用随机森林计算各项水质指标的特征重要性分
学位
几何直观能力对学生的数学学习具有重要意义,它是认识与理解数学的基础。实践证明,在概念教学、算理教学以及解题教学等环节中渗透数形结合思想,能有效地提高学生的几何直观能力,为学生核心素养的形成奠定基础。
期刊
<正>几何直观可以将复杂的数学问题变得简单易懂,有助于学生探索解决问题的思路和预测结果。简单来说,几何直观就是通过几何的手段将问题可视化,以便更好地分析问题。所以,几何直观既可以成为教师教学的一个重要工具,也可以成为辅助学生学习的有效工具。但是,在实际教学中可以发现,学生不喜欢利用几何直观去分析和解决问题,主要原因是教师并不重视这种解题方法,没有培养学生的应用意识,学生也不习惯使用这种方法。因此,
期刊
人类行为识别是计算机视觉领域的一个活跃的研究领域,包括公共安全监控、生物识别、人机交互、体感游戏和自动驾驶等领域。本文从人体运动特征表示和时空图卷积网络等方面对人体行为识别做深入研究。图卷积网络(Graph Convolutional Networks,GCN)在骨架视频动作识别方面取得了显著的性能。然而现有的基于GCN的方法大多是通过增加模型参数来提高性能。这些模型的训练需要大量的数据,所以它们
学位
随着城市智能化水平的提高,轨迹预测技术能准确预测行人未来轨迹,用以减少碰撞避免人车冲突。现有的轨迹预测技术虽然能实现简单场景内的行人轨迹预测,但在面对人员密集,干扰因素众多的复杂场景时,依旧存在着诸多问题和挑战。本文主要研究复杂场景下人与环境交互过程的内在逻辑,推测行人可能的运动目标和通过路径,在此基础上实现对行人未来轨迹的精确预测。本文提出三种行人轨迹预测器:一种学习潜变量的对抗性轨迹预测器、场
学位
再认记忆是人类重要的认知能力之一,脑电图的出现使得再认记忆的研究迈入了新的阶段。但目前关于再认记忆的脑电研究,大多着眼于事件相关电位(ERP)和行为数据分析,并未从脑功能网络角度研究再认记忆。本研究使用128导联EGI脑电采集系统,采用新旧图片再认范式,共记录了36名医学生与37名非医学生的事件相关脑电信号,研究两组受试者在对新旧图片进行再认时的大脑功能连接差异。首先,将数据分为8个子频带,采用相
学位
许多智能手机和智能可穿戴设备已经配备了多个传感器(如加速度计和陀螺仪),传感器数据更加易于获取。凭借这些优势,基于可穿戴传感器的人类活动识别近年来受到了越来越多的关注。目前,大多数的研究都是单一基本动作的识别,忽略了过渡动作的影响;对于动作的识别提取单一的统计特征,依据经验选取分类器,因此针对不同动作选择特征以及分类器的问题,提出了多特征以及多分类器的分类模型;还针对小样本的传感器数据提出自注意力
学位
抑郁症的传统量表诊断方法存在患者否认、主观偏见等缺点,同时药物、物理和心理治疗方法存在副作用大、记忆损伤严重、过分依赖医师能力等缺点。因此,无创、便携的脑电(EEG)测量技术,结合高沉浸感的虚拟现实(VR)技术,对于抑郁症的分类识别和康复训练研究具有重要意义。在抑郁症分类识别方面。首次采用相干性虚部(IC)构建Alpha、高Beta、Gamma频段的脑网络,进行连通性分析,并提取传统图论特征集。同
学位