基于DBSCAN的文本检测识别技术研究与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:frgverger343
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中的文本检测与识别在图像检索、实时翻译、信息过滤等领域都有了广泛的应用,是目前计算机视觉、人工智能等领域的热门研究课题。文本检测识别技术主要分为文本检测、文本识别两大部分,其中文本检测是文本识别的前提,对文本识别的正确率有关键性的影响。虽然文本检测在水平、垂直方向的检测能力已经非常成熟,但是对于检测任意形状的文本区域,特别是对圆弧弯曲的文本区域仍然具有挑战。在文本识别方面,传统的光学字符识别技术(OCR)对文档图像的识别正确率达到接近百分之百,但是将其应用在自然场景下的文本时,其识别效果大幅度降低,主要原因在于自然场景图像中存在大量的背景干扰,并且该图像容易受到拍摄条件的影响。这些因素给图像中的文本检测与识别带来了极大的困难。本文对现有的文本检测与识别技术进行研究与改进,针对任意形状的文本区域,提出了一种基于DBSCAN聚类算法的文本检测算法,并针对弯曲文本区域进行过滤、校正处理,使得弯曲文本的识别正确率得到明显的提高。本文主要工作包括以下几个方面:(1)针对任意形状的文本区域,提出了一种基于DBSCAN聚类算法的文本检测算法。首先,对图像进行灰度化、直方图均衡化、图像平滑、二值化预处理后,将图像中的像素点位置信息转换为二维平面的数据点,同时根据图像的文本特征,利用DBSCAN聚类算法对数据点进行聚类,进而获得图像中的文本候选区域,并有效过滤非文本区域,是对任意形状文本进行检测的一种创新思路。(2)针对文本候选区域存在嵌套的情况,设计了一种通过矩形文本候选区域面积比较的方法对嵌套区域进行过滤,同时针对弯曲文本区域存在包含过多背景等干扰元素的情况,设计了一种优化凸包算法的过滤方法进行过滤。在优化凸包算法的基础上,对Alpha Shape算法参数取值方法进行优化,并对弯曲文本区域进行进一步过滤,有效减少背景的干扰。(3)为了提高弯曲文本的识别正确率,结合仿射变换与极坐标变换,设计了一种弯曲文本校正的方法,实现弯曲文本的水平化。首先进行字符分割,再利用仿射变换进行粗处理,使分割后的文本区域尽可能水平摆放,最后针对弯曲文本区域的弯曲部分,利用极坐标变换进行精处理,最终实现弯曲文本区域整体水平化。(4)最后,利用AI开放平台实现对文本区域的字符识别,并进行对比实验。从实验结果看,本文算法对弯曲文本进行校正后,其正确率有明显的提高,具有较大的理论意义和实用价值。
其他文献
移动端由于处理能力、屏幕尺寸、网络带宽的限制,难以显示高密度的三维网格模型,因而,需要保持模型关键特征的低密度网格。对于诸如3D游戏、实景地图等应用,还需要根据视点的
近年来移动设备和GPS技术快速发展,带有时间、文本、位置等信息的兴趣点大量产生。在地理信息系统平台的支持下,空间位置查找在数据库领域受到广泛地关注。最佳区域查找(BRS)作为一种重要的位置查找问题,能够为用户返回满足目标函数的区域。近年来,学者们已经对BRS进行了大量的研究。本文考虑对象的移动性,针对路网上的BRS监测及连续查找问题进行研究。首先,针对数据流环境中的对象,提出路网上最佳区域的监测M
头部姿态估计是指通过对视频等输入信息进行处理,提取得到头部的旋转和位移数据。对于智能驾驶辅助系统来说,通过获取驾驶员头部姿态,能够实现诸如疲劳检测、增强现实抬头显示器以及头部姿态语义识别等具有环境感知能力的应用。能够极大地增强驾驶辅助系统的功能和效果。而在复杂的驾驶环境中,光照条件较差,变化程度大。同时受到成本和耐用性等因素制约,车载计算机往往基于移动平台架构,计算性能较弱。这些因素限制了高实时性
随着船舶试验技术的逐步提高,如何更贴切的描述船舶在实际海洋环境下的真实航行状态,更进一步的获取更贴切实际的试验数据,是目前船模试验的一个发展趋势。在实际海洋环境下船模在三维波浪中遭受的风、浪、流的运动情况更加接近实船在实际海洋中的运动情况,因此大尺度模型试验可以更真实的反映实船在三维非线性波浪中的运动特征。同时如何利用船模试验数据进行外推预报实船在实际海洋中的运动姿态是一个研究热点,船舶运动姿态的
光电探测器是一种将光信号转换为电信号的光电子器件,在现代科学和现实工业中有着非常重要的应用。尤其是在军事和民用领域中(夜视、目标检测、视频和生物成像)有着广阔应用的
链斗式连续卸船机已成为现代港口的主要卸船设备。随着卸船的规模化,高效化和自动化要求地不断提高,链斗式连续卸船机自动化卸料技术越来越成为人们的研究热点。提高卸料作业的工作效率,加强港口卸料的自动化水平是本课题出发点。首先,本文对课题的背景意义进行了介绍,并简述了卸船机的发展情况和国内外研究现状,介绍了链斗式连续卸船机的组成机构及工作原理。其次,论文对链斗式连续卸船机的控制系统进行了设计,根据总体控制
5G通信技术为移动互联网中的网络用户带来了高带宽、低延迟的网络服务。其中,移动边缘计算(MEC)技术,通过将核心网络中的数据中心(DC)中的计算资源迁移到距离用户更近的移动
  介绍了固定化微生物技术目前常见的四类固定化方法,以及固定化生物载体材料的选择,分析评价了该方法在废水处理中的应用,并提出了在应用中有待解决的问题。
随着中国经济“新常态”的发展变化,中国汽车零部件制造企业面临巨大的发展压力。一方面,汽车市场逐渐饱和,高速增长的局面难以持久;另一方面,原材料和人力资源价格不断上涨,造成巨大的成本挑战。在此背景下,汽车零部件企业唯有提高运营的全局效率,坚持内涵式增长,才能提升竞争能力,保持良性发展趋势。本文以国内排名前百的大型汽车零部件企业作为研究对象,在现有成熟的理论研究基础上,构建适合于汽车零部件企业的全局效
叙述并探讨通过一种模拟激光目标的实时变化,使其与导引头的相对角位置同实际飞行状况相同,并通过伺服或程控系统,使激光束的光斑尺寸随飞行距离而变化,通过可调衰减系统,使