【摘 要】
:
由于汉字笔画复杂,从视频中提取的汉字图像质量往往较差,采用传统光学字符识别(OCR)的结果不理想.为了解决低质量汉字图像的识别问题,提出一种基于分块搜索的两级识别方法.首先建立汉字图像的分块结构并模仿低质量汉字生成训练集,然后对训练集中各分块图像应用主成分分析提取特征并建立索引.待识别图像应用分块搜索和投票的方式从索引中获取候选汉字集合(一级识别),再根据投票结果的显著性辅以全局结构特征匹配识别汉
【机 构】
:
中国科学院计算技术研究所前瞻研究实验室,中国科学院研究生院
【基金项目】
:
国家“九七三”重点基础研究发展计划项目(2007CB311100), 国家“八六三”高技术研究发展计划(2009AA01A403), 国家自然科学基金(60802028), 北京市科技新星计划项目(2007B071), 北京市教育委员会共建项目专项
论文部分内容阅读
由于汉字笔画复杂,从视频中提取的汉字图像质量往往较差,采用传统光学字符识别(OCR)的结果不理想.为了解决低质量汉字图像的识别问题,提出一种基于分块搜索的两级识别方法.首先建立汉字图像的分块结构并模仿低质量汉字生成训练集,然后对训练集中各分块图像应用主成分分析提取特征并建立索引.待识别图像应用分块搜索和投票的方式从索引中获取候选汉字集合(一级识别),再根据投票结果的显著性辅以全局结构特征匹配识别汉字(二级识别).实验结果证明,该方法对于低质量汉字图像比普通的OCR方法具有更高的识别率.
其他文献
支气管肺炎是累及支气管壁和肺泡的炎症,是小儿时期最常见的肺炎,2岁以内儿童多发,全年均可发病.致病菌最常见细菌和病毒,也可由二者混合感染.近年来肺炎支原体、衣原体和流
目的:以UTAUT为理论基础,开发国内患者医疗服务信息采纳量表,了解患者对医疗服务信息的采纳现状和影响因素。方法:采用文献研究法设计量表,通过专家咨询和预调查形成量表。对
互联网金融环境下,投资者在投资过程中是否会在对过去的投资行为进行总结分析的基础上不断进行专业知识的学习,以促使自己更多的做出理性决策,提升自己的投资水平,是一个值得
对87例子宫肌瘤或腺肌瘤患者采用小切口实施子宫切除术。手术顺利,切口美观,创伤小,无并发症发生,患者住院时间短。认为小切口子宫切除术适用于子宫较大、腹腔镜及经阴手术有困难
子空间方法是人脸识别中的经典方法,其基本假设是人脸图像处于高维图像空间的低维子空间中.但是,由于光照变化、阴影、遮挡、局部镜面反射、图像噪声等因素的影响,使得子空间假设难以满足.为此,提出一种基于鲁棒主成分分析的人脸子空间重构方法.该方法将人脸图像数据矩阵表示为满足子空间假设的低秩矩阵和表征光照变化、阴影、遮挡、局部镜面反射、图像噪声等因素的误差矩阵之和,利用鲁棒主成分分析法求解低秩矩阵和误差矩阵
重症监护病房(ICU)收治的各种危重病患者常合并心力衰竭(心衰)、呼吸衰竭或多脏器功能衰竭及电解质紊乱等,常因并发快速心律失常而危及生命。2002年1月-2004年6月,我们对32例危重病
推进产业扶贫,科学选择扶贫产业及其可持续发展机制至关重要。要注意走出片面强调资源优势的误区,将资源开发与市场开发有机结合起来;走出片面追求规模扩张的误区,更加重视小
针对无向图同构的判定问题,一种层次化的基于谱分析的同构判定算法.比较两图的顶点数、边数以及度数序列对图进行预同构判定;然后对具有唯一Fiedler向量的图通过层次化的谱分析算法进行再次同构判定.与最具代表性的同构判定算法Nauty相比,随着判定图的规模增大,该算法对于规则网格图和固定度数图具有更高的同构判定效率.
最大强度差值累积结合了直接体绘制和最大强度值投影的优势,但其在累积过程中会遗漏一些局部特征.为了绘制体数据中局部特征信息,提出一种局部特征加强的直接体绘制方法.通过查找采样光线上特征边界点来确定局部最大强度的区域,利用局部差值累积的方法加强特征区域的绘制;为了提高特征分界点的查找精度,引入移动最小二乘法来平滑采样光线上的标量值,并利用用户自定义的阈值函数来控制特征的绘制;在绘制过程中,采用特征分析
针对环境噪声声场建立及其可视化,研究了基于预测模型的声线追踪过程.首先提出线声源有约束二次离散算法,通过考虑声源周围障碍物群对线声源离散过程的影响,使离散结果能够较好地等效线声源能量的连续分布特性;其次给出了直达声线、绕射声线和反射声线追踪过程,提出针对反射路径树的二次剪枝算法来实现大范围多次反射求解,并给出剪枝判据.通过在噪声地图系统中的应用可以看出,该方法能较好地降低声源离散误差,并能在复杂城