面向自然场景的汉字识别研究

被引量 : 3次 | 上传用户:shilin00100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端设备的普及与互联网技术的飞速发展,图像和视频作为传递信息的媒介,越来越多地受到人们的欢迎。随之而来的是,人们对海量图像进行处理的需求越来越迫切。如何利用计算机快速准确地提取图像中的有用信息,正日益成为众多学者研究的热点。自然场景文字识别技术有广泛的应用前景,例如基于内容的图像检索、智能交通系统、视觉辅助系统和无人驾驶汽车等等。目前国内外的研究主要集中在自然场景中英文字符的识别上,对于中文字符识别的研究还较少。本文在充分研究英文字符识别的基础上,设计实现一套适用于自然场景中文识别的方法。首先将最大稳定极值区域算法与数学形态学相结合,作为候选字符区域的提取算法,使之能够适应汉字笔画之间相互分离的特点。通过实验的对比,验证了提取算法的参数对性能的影响。其次,根据汉字的特点,设计了一组基于几何特征的启发式过滤规则,其中,将候选字符区域进行椭圆拟合,把拟合椭圆的偏心率作为判别字符区域的标准之一。通过能快速计算的特征,实现了文本区域和非文本区域的初步判别。实验显示,该启发式过滤规则能在保留原有字符区域的基础上,过滤掉大部分非字符区域。使得整个算法的效率大大提高。本文选取了具有光照鲁棒性的强有力的特征描述子方向梯度直方图特征作为字符区域的特征向量。通过训练一个支持向量机分类器,实现了文本区域的精确检测定位。众所周知,汉字数量庞大,结构复杂,字体形态多变,要在场景图像中收集到覆盖所有类别的汉字样本十分困难。因此本文中不直接采用场景图像中的汉字作为识别的样本,而是通过调研场景中常见的各种汉字字体,对应每种字体生成了不同尺度的汉字作为识别样本,通过KNN分类器进行识别。实验证明,本文方法取得了令人满意的效果。
其他文献
云存储系统为存储大规模数据应运而生,其底层采用分布式文件系统作为存储平台。HDFS(Hadoop Distributed File Sysytem)是开源的云计算平台Hadoop提出的分布式文件系统,其设
互联网的快速发展,使得网络的规模越来越庞大,结构越来越复杂,网络用户数量呈指数级增长,而网络中的非关键业务的泛滥也导致网络的带宽资源被大量地消耗,影响了其他关键网络
随着电信企业的重组和3G牌照的发放,中国电信市场进入更加激烈的全业务竞争时代,如何适应日趋激烈的市场竞争环境,成为电信企业的重要问题。电信行业重组,中国移动面临着诸多
现代科技高速发展,人们渴望能用本民族语言以自然、直接的方式同计算机进行交流。因此,自然语言的语义分析研究具有十分重要的意义。由于自然语言的本身局限性和语言信息传递
动态电子商务作为第三代互联网模式已经成为当今IT业的热门话题之一。这种新型的电子商务模式可以减少人工参与的步骤,提高工作效率和用户使用的便利性。通过动态电子商务技
由于大气湍流的影响,以及各国深空探测脚步的加快,地基光学望远镜获得衍射极限图像的技术受到国内外天文研究人员的高度重视。幸运成像技术是通过对目标序列短曝光图像数据进
数据库系统的负载自适应是指数据库管理系统通过对负载的过滤和控制有效利用系统资源、满足负载性能要求的过程。自治数据库负载管理框架(AWMF:Autonomic Workload Managemen
随着经济的发展和社会信息化程度的提高,人们的生活质量和工作效率也越来越高,消费者对企业的服务质量也提出了越来越高的要求。企业为了争夺客户资源,必须准确把握住消费者的需
软件的可信主要体现在其行为的可信上,许多专家和学者越来越多地通过对软件行为的监测、信任关系的评价和异常行为的控制,来保证计算机系统能够安全的运行。由于软件行为可信
实际应用中,子空间聚类方法可以从高维数据中寻找一个低维表示,用少量的数据就能去描述整个数据空间。这在很大程度上提升了高维数据处理的效率。目前已存在不同形式的子空间