基于手持终端的自然场景下文本识别及后处理

被引量 : 0次 | 上传用户:SMXYIMASHI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化社会的深入快速发展,多媒体技术受到越来越多人的关注,具有拍照功能的手持终端产品得到了广泛的普及,其中最具代表性的就是智能手机。智能手机的普及,不仅使人们在日常生活中获取自然场景图像更加容易,而且给自然场景图像的文本信息提取带来了广阔的应用前景。由于自然环境中文本的颜色多样、文字大小变化范围大并且有不同的排列方式,而且图像背景通常较为复杂,所以对自然场景下的文本进行定位和识别是一个非常有挑战性的课题。本文基于手持终端设备,对自然场景下文本的定位、识别以及识别后处理进行研究,开发出了一套完整的基于手持设备的文本信息提取系统,主要内容如下:1、自然场景下文本定位本文采用的是一种半自动的基于颜色聚类的文本定位方法,通过手持设备的手写笔人工地选择某一目标颜色点,然后对图像进行分析继而进行颜色聚类,最后进行连通域处理,给出文本定位的结果。2、自然场景下文本识别通过对自然场景图像进行文本定位得到文本的位置,接着对文本所在区域的图像进行二值化处理并去除孤立的噪声点,再进一步进行单字符的切分、剪裁和归一化操作,然后对归一化后的图像提取方向线素特征,最后把特征向量输入到欧式距离分类器,得出识别结果。3、自然场景下文本识别的后处理在文本识别之后需要对识别结果做后处理,以进一步提高文本的识别率。首先建立词汇联想所必需的联想词库,接着设计了基于标记的词条存储方法;然后对包含文本的矩形框进行排序,确保相邻位置的汉字具有组词的可能性;最后给出了“前向—后向搜索”以及自适应词汇联想的具体实现过程。
其他文献
突触可塑性是学习和记忆的神经基础,随着近些年对内源性大麻素系统研究的深入,内源性大麻素作为逆向信号分子在突触信号传递中发挥调节作用引起了重视。内源性大麻素系统介导
锂空气电池具有超大的理论比容量(3860mAh.g-1)和理论比能量(11400Wh.kg-1),大大超过任一种化学电源,是一种环境友好的新型电池。近年来,科研人员对锂空气电池的电解质材料和正
文章主要围绕传统营销组合 4P’S ,探讨了互联网条件下营销组合策略的创新 ,提出了网络整合营销的思想。
集装箱运输是目前发展最快的海上运输形式,作为海运衍生市场的港口企业也纷纷投资集装箱运输市场。作为服务类产业的港口企业,只有不断提高自身的服务质量,才能稳定原有客户,
[目的]探讨细节护理对手术室感染的预防作用。[方法]将234例外科手术病人随机分为观察组与对照组各117例,观察组病人给予细节护理,对照组病人给予传统护理。观察两组术后感染
价格发现是远期外汇市场的核心功能,是一个将市场上所包含的信息集通过投资者之间的交易行为转化为公开市场价格的过程。远期和即期汇率之间的联动关系强弱一定程度上反映了
历史时期人类社会与自然环境的互动关系,也就是我们常说的人地关系是历史地理学研究的重要课题。在这一领域内,辽金时期的西辽河流域具有非常鲜明的自身特点。首先,西辽河流域地
生长在邻近或累及功能区的脑肿瘤,手术过程中对神经功能的保护不仅仅强调皮质功能区,还依赖于皮质下纤维传导束的完整。纤维束示踪技术(DTT)是在弥散张量成像(DTI)基础上,通过选取某
管式换热器是工业上常用的余热回收装置,在实际运行中,其各种条件不会一成不变,时刻处于不稳定的状态。如何控制换热器运行在最佳工况,对于新设计的换热器,如何得到其动态特
地震应急救援是一个极其复杂的过程,并受着各种影响因素的制约。随着计算机技术、通讯技术、数据库技术、地理信息系统与决策支持系统等技术的普及与发展,为地震应急研究奠定