面向盲人视觉辅助系统的自然场景文本检测

来源 :中南大学 | 被引量 : 0次 | 上传用户:soboy1478
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘要:自然场景图像中的文本信息为许多基于图像的应用提供了重要线索,其中,盲人视觉辅助系统是重要应用之一。该系统首先通过图像采集设备获取周围环境信息,然后使用文本定位技术提取图像中的文本,并通过字符识别技术识别文本,最后以语音信号形式反馈识别结果。系统将周围环境信息从文本转换为语音信号的形式,从而达到视觉辅助的目的。盲人视觉辅助系统运用了大量计算机技术,其中,自然场景图像文本检测技术显得尤为重要。精确定位文本,是提高字符识别率,输出正确环境描述的关键,对于辅助弱势人群和盲人正常生活具有重要意义。然而,场景图像背景复杂,图像中的文本变化多样,因此,场景文本检测是一个重要且具有挑战性的课题。本文提出了一种基于色彩聚类的自然场景文本检测算法,主要由以下四个部分组成:(1)色彩聚类。同一自然场景图像中的文本色彩相近,利用这种特性可定位文本。分别提取图像在R、G、B三个通道上的色彩分量作为特征,用K-均值算法将图像上的像素点聚类形成5个色彩层。(2)字符验证。色彩聚类结果包含了文本和大量离散的非文本连通域。为了减小字符合并时的计算量,移除离散的背景信息,分别采用字符几何和结构分析方法,验证候选字符。(3)字符合并。为了将分散的文本字符连接形成连通的文本区域,本文提出基于几何特性和空间位置关系的字符合并算法。(4)文本块验证。字符合并形成的候选文本块,包括真实文本块和错误检测的非文本块,为了提高文本检测的正确率,需要对候选文本块进行验证。本文分别采用几何性质分析和边缘密度判断的方法对候选文本块进行验证。将本文算法在公共数据库ICDAR2003上进行试验,结果表明本文算法能检测出不同场景图像的文本。对本文方法和其他已有场景文本检测方法进行定量比较,结果表明了本文算法的优越性。图46幅,表1个,参考文献55篇。
其他文献
随着社会的不断发展,世界越来越趋近国际化.英语作为一门国际化的语言,也逐渐被人们所重视.而小学阶段又是学习英语的最重要的一个阶段,在这个阶段帮学生打好基础,对学生未来
在连铸生产过程中所发生的各类事故中,危害最严重的便是漏钢事故。开发漏钢预报技术是防止漏钢事故发生的有效手段,具有重要的理论研究价值和重大的经济意义。因此,本文参考
癌症是严重威胁人类健康的重大疾病。最新统计结果表明,截至2014年我国癌症发病率已接近0.2%,即每年每十万人中有200个新发癌症病例,且死亡率亦高达0.1%,即每年每十万人中有1
本文通过对荣华二采区10
期刊
随着教育模式的改革,传统的数学教学方式已经难以满足当下的教育需求,教育部门各方都在积极探索数学教学的最佳模式,而合作学习在数学教学中的显著成效也开始逐渐显现.顾名思
铜阳极泥是一种富含金银等贵金属的重要物料,世界金银产量的相当一部分来自铜阳极泥。近十几年来,随着黄金价格的不断上涨,从阳极泥中有效地回收金银等贵金属及综合利用其它有价
综合实践活动实际上就是在充分了解学生的学习兴趣与爱好之后,将学生的实际生活与社会情况进行系统整合形成的问题当作主要内容,采用探究性的学习方法,用于实现学生创新精神
随着社会的不断发展,教育领域的生源竞争也越发激励,由此导致中职学校的生源质量明显下降,学生学习水平参差不齐.中职学生普遍存在学习基础差、学习效率低、主动性差等特点,
小学数学教学不仅仅在于课本知识层面,而是应以培养学舌综合素质为出发点,培养学生的自主能动性,让学生在探究中学习,在学习中通过不断自主探究来提高自身发展.现阶段许多教
化学课程是高中阶段的重要基础课程,当然,化学课程的学习也具有一定的学习难度,特别是化学课程中常常涉及到的化学结构式.方程式以及一些基础性概念,不仅提高了学生的学习难