基于SLIC和OTSU的自然场景文本分割方法研究

来源 :武汉大学 | 被引量 : 3次 | 上传用户:huangxinyu322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种具有摄像功能的移动电子设备的普及,越来越多的信息以自然场景图像为载体而存在。图像中文本信息对于理解场景、认知场景图像具有相当重要的意义。自然场景图像中的文本识别可以分为三个步骤,文本定位、文本分割、字符识别。首先要在自然场景图像中找到文本区域的位置,其次将文本从图像背景中分离出来,最后对分离出的文本进行字符识别,从而达到文本识别的目标。自然场景图像中存在颜色多变、光照不均、背景复杂等问题,这些问题会使文本的分割过程存在很大的挑战。基于阈值的方法在自然场景文本分割中比较常见,但通常只利用灰度值信息进行二值化,没有考虑像素点的空间信息。本文针对这个问题,提出了基于超像素和最大类间方差算法的文本分割方法,通过超像素信息将像素的空间信息应用到图像二值化的过程中,然后使用tesseract方法对文本分割结果进行识别,以验证本文提出的文本分割方法的有效性。首先对自然场景图像使用SLIC(简单线性迭代聚类)算法生成超像素标记,对图像进行过分割。然后对同一幅图像进行灰度化、均衡化、去噪,使用OTSU(最大类间方差法)进行二值化。再结合过分割图像和二值化结果,得到最终的文本分割结果。关于字符识别步骤,针对自然场景文本,对tesseract引擎进行相应的训练,然后使用训练之后的tesseract引擎对文本分割结果进行识别,再通过设计的识别结果修正环节得到最终的识别结果。最后,通过比较本文的文本分割结果与其他方法得到的文本分割结果在tesseract方法下的识别率,来比较文本分割结果的优劣。本文采用ICDAR 2013自然场景图像的数据集对本文的文本分割方法进行检验,通过使用tesseract方法对分割结果进行识别来检验文本分割结果。实验证明本文提出的基于SLIC和OTSU的文本分割方法取得了较为理想的分割结果。
其他文献
在过去用低温沸腾氯化法处理攀枝花钛精矿试验研究的基础上,拟定了用低温氯化法处理攀钢高炉渣的两个试验流程,并进行了初步试验研究。结果表明,在500—700℃下,将高炉渣配碳
细菌的外排系统是一种非特异性耐药机制,是通过细菌外排泵将进入菌体内的药物或其他底物排出膜外,它可以泵出多种对其自身有害的物质,包括喹诺酮类、氯霉素、红霉素、四环素
资本主义的发展,从自由竞争的资本主义,经过垄断资本主义,变成金融资本主义,它最终将走向何方?在21世纪初,被金融海啸猛烈冲击的所有人,不能不严肃地思考这个问题。
目的了解重庆市小学生对突发事件心理危机干预的需求,为建立小学生突发事件心理危机干预体系提供依据。方法整群随机抽取重庆市7所小学1 110名四~六年级学生,采用自编“突发事
改革开放不仅带来中国经济的快速发展,而且也造就了转型经济条件下中国第一代富裕人群。由于富裕人群需要财富管理,本研究通过定量调研,试图探析富裕人群具有普遍意义的金融
近几年来,学术界对政府能力建设问题的研究取得了突破性的进展,关于政府能力建设问题的探讨文章比以前大大增加.无论从数量上还是质量上分析.都远远超过以往的任何一个时期.
金融资本新霸权是当代资本主义最基本特征。金融资本建构起了由金融化、新自由主义体制与全球化构成的立体霸权结构。新自由主义体制是其在资本主义国内经济秩序中的体现,全
随着我国高等教育的改革和发展,大学生的数量在不断的增加,这在一定程度上影响了大学生的就业。在高等医学教育中也存在着一系列的就业问题,由于医学专业有着专业的特殊性和
针对光电信息工程本科专业实习教学资源少、内容多、机动性高的现状,在实习教学中注重结合不同实习单位的优势与特色,在强化生产车间“学徒制”实习的同时.通过技术讲座、参观实
建立健全动物防疫法律体系是保护养殖业发展,维护公共卫生安全、保护人体健康的重要方略。我国现行的动物防疫法律法规经翊几十年的建设取得了巨大的成就,但是与当前新形势以及