论文部分内容阅读
电力设备台账是电力系统中反映电力设备状况、各类设备拥有量、设备分布等情况的主要依据,其中一部分重要的台账数据来源于设备铭牌。设备台账的质量对电力系统设备管理有着很大的影响。然而,目前我国电力系统中仍存在设备台账数据丢失、准确性低等问题。传统的方法通过人工方式录入铭牌数据或校核铭牌与台账的一致性,具有效率低、准确性差等缺点。因此,本文采用基于深度学习的图像识别技术提取铭牌图片中的文本信息,可以用于录入与核查设备台账数据,提高工作效率与准确性。本文的研究对象为变电设备铭牌,主要研究内容包括铭牌定位、铭牌文本检测以及铭牌文本识别。
首先,本文基于目标检测算法YOLO(You Only Look Once)设计了铭牌定位模型,并对模型的损失函数进行改进,以解决检测框损失不合理和样本不均衡的问题。其中,采用数据增广的方式扩充数据集,以解决数据不足的问题,并通过聚类方法和参数预搜索方法获取模型的最佳超参数。实验结果表明,改进后的模型能有效定位出复杂背景图片中的铭牌区域。此外,还利用剪枝技术对训练好的模型进行压缩,在仅损失少量精度的情况下,大大减少了模型参数与计算量,提高了铭牌定位速度。
其次,本文在铭牌定位的基础上设计了基于EAST(Efficient and Accurate Scene Text Detector )算法的铭牌文本检测模型,并提出了一种快速的非极大抑制(Non-maximum Suppression,NMS)算法来解决铭牌文本数量多、检测耗时的问题。实验结果表明,提出的文本检测模型能有效检测出铭牌图片中不同类型、不同尺度的文本。同时,提出的 NMS 算法能在不影响检测精度的情况下大幅降低非极大抑制处理时间,且能有效解决长文本检测不完全的问题。另外,还提出了一种基于透视变换的铭牌文本倾斜角度计算方法,用于辅助EAST算法,实验表明该方法在检测倾斜角较大的铭牌上更具优势,但鲁棒性较差。
再次,本文在铭牌文本检测的基础上设计了基于CRNN(Convolutional Recurrent Neural Network)算法的铭牌文本识别模型,并根据变电设备铭牌文本的特点,人工合成了大量的文本图片数据,以解决铭牌文本数据量小、标注难的问题。实验中首先利用开源文本数据集对文本识别模型进行预训练,接着使用真实铭牌文本数据与合成数据对预训练模型进行微调,提高了模型对铭牌文本的识别能力。此外,还采用基于字典的文本纠正方法对文本识别结果进行纠正,提高了铭牌文本识别的准确率。
最后,本文将铭牌定位、文本检测与文本识别模块整合,实现了完整的铭牌文本识别功能,并设计了相应的软件系统。另外,还将变电设备铭牌文本识别系统应用到设备台账校核中,用于判断台账的准确性,并提供台账修改建议。
首先,本文基于目标检测算法YOLO(You Only Look Once)设计了铭牌定位模型,并对模型的损失函数进行改进,以解决检测框损失不合理和样本不均衡的问题。其中,采用数据增广的方式扩充数据集,以解决数据不足的问题,并通过聚类方法和参数预搜索方法获取模型的最佳超参数。实验结果表明,改进后的模型能有效定位出复杂背景图片中的铭牌区域。此外,还利用剪枝技术对训练好的模型进行压缩,在仅损失少量精度的情况下,大大减少了模型参数与计算量,提高了铭牌定位速度。
其次,本文在铭牌定位的基础上设计了基于EAST(Efficient and Accurate Scene Text Detector )算法的铭牌文本检测模型,并提出了一种快速的非极大抑制(Non-maximum Suppression,NMS)算法来解决铭牌文本数量多、检测耗时的问题。实验结果表明,提出的文本检测模型能有效检测出铭牌图片中不同类型、不同尺度的文本。同时,提出的 NMS 算法能在不影响检测精度的情况下大幅降低非极大抑制处理时间,且能有效解决长文本检测不完全的问题。另外,还提出了一种基于透视变换的铭牌文本倾斜角度计算方法,用于辅助EAST算法,实验表明该方法在检测倾斜角较大的铭牌上更具优势,但鲁棒性较差。
再次,本文在铭牌文本检测的基础上设计了基于CRNN(Convolutional Recurrent Neural Network)算法的铭牌文本识别模型,并根据变电设备铭牌文本的特点,人工合成了大量的文本图片数据,以解决铭牌文本数据量小、标注难的问题。实验中首先利用开源文本数据集对文本识别模型进行预训练,接着使用真实铭牌文本数据与合成数据对预训练模型进行微调,提高了模型对铭牌文本的识别能力。此外,还采用基于字典的文本纠正方法对文本识别结果进行纠正,提高了铭牌文本识别的准确率。
最后,本文将铭牌定位、文本检测与文本识别模块整合,实现了完整的铭牌文本识别功能,并设计了相应的软件系统。另外,还将变电设备铭牌文本识别系统应用到设备台账校核中,用于判断台账的准确性,并提供台账修改建议。