基于特征增强和自适应分割的集装箱文本识别算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户：xiaoshancx

【摘要】

：

【作者】

：

冯兴齐

【机构】

：

武汉理工大学

【出处】

：

武汉理工大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研发集装箱后箱面净重、毛重等文本信息的识别技术是提高码头集装箱装卸效率,实现堆场作业自动化和智能化的关键环节。目前该领域现有识别算法主要以桥吊、闸口等位置的箱号为研究对象,但在堆场环境下,后箱面重量、体积等多类型密集排布的文本识别问题仍处于研究阶段。本文针对堆场集装箱后箱面的重量文本、体积文本及箱号文本识别任务展开研究,以开发鲁棒性强、精度高和速度快的算法为目标。在像素级分割的文本检测框架下,提出了基于特征增强和自适应分割的检测网络,并结合改进型MORAN端到端识别网络完成整体算法设计,最终得到一种鲁棒性强,兼顾高精度和高速度的集装箱文本识别算法。整体算法由检测和识别两个子系统而成,设计内容主要包含四个方面:（1）提出FPD-AN（Feature Pyramid Dilation-Attention Net）网络来实现特征增强功能。该网络以轻量化Shuffle Net＿v2为骨干,利用高维特征对低维特征的加权计算来增强检测网络的特征表达能力,并采用空洞卷积和全局平均池化来扩大感受野。（2）采用自适应阈值分割后处理方式。设计可监督学习的阈值来高效完成文本边缘分割,从而解决文本密集分布和耗时长的问题,同时采用更倾向于挖掘前景区域的dice loss训练,以解决正负样本不平衡问题。（3）应用端到端识别网络MORAN解决文本的尺度不一、污损、残缺、畸变和遮挡等问题。其中通过矫正子网络MORN的像素级弱监督学习机制对倾斜、畸变文本进行矫正;通过识别子网络ASRN的注意力机制增强网络记忆功能。（4）设计基于Dense Net的特征提取网络改进MORAN算法,充分提高特征提取效率,提高算法的抗过拟合性和识别精度。本文数据集来自我国海洋大港集装箱堆场采集到的后箱面样本,经仿真结果表明,（1）（2）两项设计使集装箱文本检测准确率达到89.74%,F1 score和FPS分别为0.909和7.61;（3）（4）两项设计使文本识别准确率达到96%,FPS为14.6。整体仿真识别率达到92.6%,FPS为13.5。相比现有像素级分割的PSENet+MORAN和DBNet+MORAN识别算法,本文算法在保持速度优势的同时,在精度上分别提高了4.1%和8.3%,基本达到了预期指标。最后,开发应用程序并进行现场调试。经工程测试可知,本文算法识别精度可达到90%,单帧识别时间在600ms内,能有效解决识别精度和速度的平衡问题,满足堆场集装箱装卸作业的实际需求。

其他文献

网络中观结构对复杂动力学行为的影响及应用研究

进入21世纪以来,以通信、计算机为代表的人工智能的迅猛发展使现代社会加速迈入了智能化时代。如今,通信社交、智能电网等不同领域呈现出网络化趋势,各种各样的网络化复杂系统出现在人们的工作和生活中。研究网络中复杂动力学行为有助于人们清晰地认识动力学的行为特性,有助于科学规划和设计复杂系统。因此,本文基于网络中常见的中观结构,研究了不同动力学的行为特性,揭示了中观结构的变化如何影响动力学的行为。本文的主要

学位

分层式视觉引导下焊接路径自适应规划算法研究

我国制造业正在从劳动密集型向技术密集型转化,推出低成本、高稳定性的智能焊接机器人系统,一方面可使部分焊工从恶劣的环境中解放出来,另一方面也能提高焊接效率和工件品质的一致性,对我国焊接机器人技术发展和积累皆有重要意义。虽然示教型焊接机器人系统得到广泛使用,但在焊接过程中,当工件发生形变时,它只能按照预先设定的焊接路径与参数进行焊接而无法实时纠偏。离线编程型焊接机器人可通过提前规划的路径完成焊接,且焊

学位

面向不平衡和高维医疗数据的分类方法研究与应用

从海量的医疗信息中发现有价值的信息已成为机器学习等领域的热点研究内容,医疗数据分类是其中一项重要技术。现实医疗数据存在不同类别样本数量不平衡的问题,训练的分类模型易偏向多数类（正常人）而忽视蕴含更多价值信息的少数类（疾病患者）。另外医疗数据中的特征维度高且复杂,其中存在大量的无关和冗余特征,将全部特征用于训练分类模型不但会增加计算成本而且会降低分类性能。本文围绕上述两个问题开展研究,主要内容如下:

学位

基于深度强化学习的智能车驾驶行为决策研究

随着人工智能技术的快速发展,汽车的智能化水平与日俱增,结构化道路作为最常见和最重要的交通场景,是实现自动驾驶典型的应用场景。在自动驾驶技术中,智能车的驾驶行为决策一直是研究的热点和难点,目前主流的决策方法主要基于专家规则,缺少对环境的适应性和泛化性。本文以智能车为研究对象,基于结构化道路交通环境,面向直道、并道以及环岛三种典型场景,针对智能车行为决策的特殊性和环境的多样性,提出了两种基于深度强化学

学位

无线电能传输系统Tube模型预测控制研究

电动汽车因其安全可靠、能源充足、污染气体零排放等优点受到了社会各界人士的广泛关注。无线电能传输技术可以解决充电难、储能慢、续航短、电池容量小等限制了电动汽车普及的问题,但抗干扰能力弱、功率波动大、可靠性低等缺点局限了该技术的应用。为了增强抗干扰能力、减小功率波动、提高可靠性,本文分析并设计了无线电能传输系统,并深入研究了系统特性和控制策略。本文的主要研究内容如下:分析了无线电能传输系统的电气特性以

学位

基于一致性估计的半监督学习方法研究

深度学习在计算机视觉、自然语言处理、语音信号识别等领域都取得了成功。在有限的样本下训练深度学习模型通常会遇到过拟合的问题,而增加数据量是缓解过拟合的有效手段。然而在实际中利用人工标注数据往往是代价昂贵的,因此需要设计有效的半监督学习方法利用未标记数据进一步提升模型的泛化能力。本文针对半监督分类任务,对传统的一致性估计方法进行了研究,主要研究内容如下:（1）Temporal Ensembling模型

学位

基于分解和集成的风速超短期预测研究

要达到可持续发展的目标可以通过对可再生能源的有效管理来实现,其中,风能作为最有前景的可再生能源之一,以其可再生性和可持续性受到世界各国的关注。随着风电系统在电网中所占比例的急剧提升,准确的风速预测对风力发电机组的稳定运行,对风电的利用和并网都是至关重要。然而,风速的灵活性和间歇性使得准确的风速预测成为一项具有挑战性的任务,基于此,提出了一个基于分解和集成的风速超短期预测模型。所提出的风速超短期预测

学位

基于双目视觉的自动泊车系统研究

自动泊车系统作为高级辅助驾驶系统的重要组成部分,随着无人驾驶技术的发展其应用市场与研究前景也愈发广阔。根据自动泊车系统运行阶段的不同,本文将其按功能划分为可停车位检测与车辆控制两部分,前者负责在车辆行驶过程中搜寻可停车位坐标,后者包含路径规划、车辆定位和路径跟踪,负责在规划泊车路径后根据车辆与车位之间的相对位置关系控制车辆完成泊车。针对以往研究中感知设备在车位检测中的局限性,本文设计一种基于双目相

学位

数据驱动的工业过程故障诊断方法研究

工业生产过程在国民经济中占有重要地位,但是工业过程的复杂度、自动化程度和集成度不断提高导致工业过程发生故障的可能性也越来越大,因此对于工业过程的监测是十分必要的。但是对于传统的故障检测与诊断方法还存在以下问题:（1）传统的基于欧氏距离相似度为判别标准的多模主成分分析方法没有考虑到负载矩阵中向量的方向性,导致判别结果错误;（2）传统的两步主成分分析方法假设变量之间是线性关系以及数据服从高斯分布,但是

学位

电容式电压互感器计量误差智能预测研究

电容式电压互感器（Capacitor Voltage Transformer,CVT）作为电能测量系统的重要组成单元,其计量误差是影响电能交易公平性的重要参数。目前对CVT计量误差的研究集中在误差监测方法上,而忽略了误差预测对准确计量和设备运维的重要意义。因此,本文提出了CVT计量误差智能预测方法,主要内容如下。首先,进行了CVT计量误差影响因素的机理分析。以CVT的电路结构为基础,分析了CVT计

学位

基于特征增强和自适应分割的集装箱文本识别算法研究

与本文相关的学术论文