一种针对汉字特点的场景图像中文文本定位算法

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:bmhk1002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对场景图像中的中文文本定位问题,提出一种基于汉字特点的中文文本定位算法。算法首先对图像提取MSER(最大稳定极值区域),然后通过剪枝策略对存在嵌套关系的MSER进行取舍,得到候选笔画区域;计算候选区域的笔画宽度,作为闭操作的结构元参数并对图像进行动态闭操作,以消除同一汉字笔画之间的间隙,得到候选汉字区域;利用结构和角点规则过滤掉非汉字区域,并用颜色规则聚类得到候选文本区域;最后基于图像文本大都横向或纵向排列的规律,通过分析各组连通区的分布情况,对候选文本区域进行确定。在测试数据集上的实验表明,算法对于汉字与背景色差明显、汉字成行或成列排列等场景文本具有定位稳定性和准确性。
其他文献
目的探讨自体大隐静脉上肢移植内瘘的临床应用及护理。方法选择2012年8月-2013年4月在某院血液净化中心维持性血液透析的患者10例。这些患者的吻合动脉为上肢肱动脉或桡动脉,
随着自主学习理论在语言学习中的引入, 研究人员开始普遍关注怎样构建适于自主学习的学习环境. 二十世纪九十年代网络教育的兴起为解决这一问题开辟了新的途径. 网络教育的本
目的 :探讨辅酶 Q1 0 对老年冠心病患者自由基的影响。方法 :观测 30例老年冠心病患者辅酶 Q1 0 治疗前、后超氧化物岐化酶 (SOD)和丙二醛 (MDA)含量的变化 ,并与对照组比较
随着我国经济建设的飞速发展以及人民生活水平的不断提高,桥梁工程建筑技术出现了前所未有的崭新发展局面。但是,局部复杂结构的应力分布情况不能通过目前广泛采用的等效梁模
近年来,数据挖掘技术已经引起了信息产业界的广泛关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。对数据挖掘技术进行系统和深入细致的研究是全球信息
随着信息技术的发展,高校英语教学正在酝酿着一场新的变革,网络多媒体技术正在成为英语教学的崭新手段。大学英文写作作为大学英语教学中的薄弱部分应该受到关注和重视。本文
东濮凹陷经过二十多年的勘探开发,已进入高成熟勘探阶段,岩性油气藏必然地成为东濮凹陷勘探的主要方向。本课题利用东濮凹陷现有的勘探生产和研究资料,在充分吸收、消化、综
织物表观性能是纺织品质量控制的一项重要指标,而织物表面平整度表征了纺织品外观的光滑程度。织物平整度的传统评估一般是通过眼光目测的主观方法进行,易产生人为偏差。计算
药物的耳毒性虽然早已引起广泛的关注,但是目前我国每年新增的3~4万聋儿中,仍大约有50%左右是药物引起的。大多数耳毒性药物已被临床医师和药理学家所认识,但丙戊酸钠对听力影
随着网络的迅速发展和扩张,网络对人类的影响也日益深入。网络在给人类带来巨大方便和自由等诸多好处的同时,也带来了许多消极的因素,引发了一系列的伦理道德问题。为了让网