基于边缘和纹理的文本定位算法的研究

被引量 : 0次 | 上传用户:ningyuanhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图片中包含许多有用的信息,如街道名称、商店名称、交通标识等。准确地从自然场景图像中获取文字信息是数字图像处理中一个重要的研究内容。从自然场景图片中抽取文字信息的研究包括两个部分:文本区域定位和文字识别,文本区域的准确定位是文字识别的重要前提。这是一个比较复杂的研究内容,主要原因是图像中文字的字体、大小、方向、位置千变万化,还可能因为获取条件的限制使得文字比较模糊或者被其它物体遮挡。本文提出了一种基于边缘检测和纹理分析的方法来对场景图片中的文本区域进行定位。首先将图像中像素点的像素值均衡地规划到0和255之间,用来消除图像中明暗程度的差异对系统产生的影响。自然场景图片中的文本和背景之间通常在色彩或者亮度上存在一定的差异,因此利用这一点可以通过边缘检测的方法来得到图像中的文本候选区域。为了突出图像中的文本信息,先将原始图像映射到一致性空间,然后在一致性空间使用滑动窗口对候选区域进行扫描,提取滑动窗口内图像的特征。在研究过程中所使用的特征包括灰度共生矩阵特征和统计量特征。支持向量机方法是一种比较重要的分类方法,在我们的研究过程中得到了应用。通过交叉验证和网格搜索的方法来确定分类器的最优参数,同时避免了过拟合问题的发生。但是支持向量机方法没有特征选择的功能。在确定分类器的最优参数之前,通过分析每个特征的数据分布情况来选择特征进行分类器的训练。分类器参数确定之后,依据特征空间优化准则,使用不同的特征选择策略,对原来的特征空间进行优化。将分类器的判别结果映射到结果图像,定位出图像中的文本区域,并将相邻相似的区域进行合并,确定文本区域的最终位置。对文本定位来说,期望识别系统能够像人一样准确的分辨文本区域的边界是不现实的,对系统的衡量也需要综合各方面的因素。最后,通过使用区域匹配和基于数量的两种衡量标准对系统进行评价。通过实验表明,本文提出的方法能够很好的解决图像中文本字体大小变化的情况,得到较好的结果
其他文献
研究目的:调查初产妇及其配偶各自的心理健康、社会支持、应对方式的状况以及社会支持、应对方式与心理健康的相关性,并且进一步分析影响初产妇及配偶心理健康水平的因素,以
当公共突发事件发生时,应急反应的一项重要工作是及时运输救援物资和救援人员到达事发现场,并保障伤员迅速得到治疗,而这些运输任务的顺利完成又是以合理、高效的车辆组织和
并联机器人具有刚度好,结构稳定,承载能力强,运动精度高等特点,并且并联机构逆解容易,利于机器人的在线实时计算,因此并联机器人弥补了串联机器人的缺点,扩大了机器人的应用
传统的PLC经过几十年的发展,在工业控制领域得到了广泛的应用,但是其开放性差的缺点也越来越突出。软PLC系统使用软件技术来实现传统PLC的功能,解决了传统PLC的兼容性差、开
载人航天器舱内的流动换热及通风系统的研究对于航天器的正常运转非常重要,而目前载人航天器舱内的气流分布设计还存在着随意性,需要进行系统研究。本文以航天器工作座舱为研
发电机单机容量越大,经济性能越好,但增大容量对发电机绝缘系统的运行稳定性增加了诸多不利因素。迄今,国内生产的最大发电机组是三峡发电机,单机容量700MW,额定电压20kV。而
本文系统的研究了聚合物包覆纳米SiO2的制备工艺与方法,采用无皂乳液聚合法和预聚物包覆法分别成功制备了聚甲基丙烯酸甲酯(PMMA)和三聚氰胺-甲醛树脂(MFR)包覆改性纳米SiO2
城市空间压力剧增,高层建筑在城市建筑中所占的比例也随之增大。高支模施工安全控制质量对于建筑施工质量影响巨大。对于高支模施工,应当环环相扣,抓好每一个施工环节的质量
藏南河谷分布在以雅鲁藏布江为主要水系的河谷平原上,这一地区是西藏主要的农产区,也是整个藏区农业文明发展的源头之一;此外,藏南河谷地区地处历史上被称为“卫藏”的地区,
在建设社会主义和谐社会的大背景下,加强对权力的制约和监督,是实践“三个代表”、贯彻落实科学发展观和构建社会主义和谐社会重要思想的具体体现,是发展社会主义民主政治、