基于图像匹配的汉字识别系统研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zhang_ts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字是世界上使用人数最多的文字,它具有不同于字母的特性,同时信息技术的飞速发展使得信息的存在形式各种各样,因此,有效地处理汉字信息是信息处理的一个关键问题。目前的汉字识别研究多数以OCR(Optical Character Recognition)系统作为基础,研究成果取得了很大成绩,但是目前的汉字识别系统仍有不足之处,对输入图像的质量要求较高。鉴于此,利用局部特征不变量的优势研究新型的汉字识别系统,具有十分重要的意义。本文首先对目前的汉字识别系统进行研究与分析,在此基础上本文总结了目前汉字识别系统的难点和不足之处。其次,本文提出了一种以图像匹配为基准的新型的汉字识别系统,它以SIFT(Scale Invariant Feature Transform)作为特征提取的表述,整个系统框架设计成3个主要模块:图像的特征提取模块,高维向量索引模块,相似性匹配模块,然后本文进一步分析和解释系统框架中各个模块的作用,重点介绍了主要模块的设计算法。最后,根据提出的系统设计方案,本文实现了这个新型的汉字识别系统。针对本文的研究目的,本文对新型的汉字识别系统进行规模测试,验证本文系统的可行性,然后再根据实验结果分析本文系统的特性。经过大规模测试得出结论,本文提出的新型汉字识别系统具有可行性,SIFT特征具有表述汉字特征的能力,而且本文的系统对拉伸,旋转,仿射,复杂背景,噪声等情况具有一定的鲁棒性。
其他文献
社会保障作为近现代工业文明的产物,历经百余年的发展,从作为解决劳动纠纷的一种应急措施演进为一种社会的系统功能,覆盖面从城市劳工扩展到全体公民,保障项目从零星分散发展
通过大量田间试验,以哈尔滨市城市污水处理厂的脱水污泥为原料,采用卧式旋转式污泥好氧发酵装置对脱水活性污泥进行有氧发酵。同时将发酵后的活性污泥作为有机肥料进行了田间
目前烟草行业在我国经济中占有非常重要的地位,是我国政府财政收入的重要来源之一,烟草行业已成为我国一个非常大的产业。同时我国是世界卫生组织《烟草控制框架公约》成员,
<正>分野最初是以十二次的形式出现的,主要用于岁星星占——根据岁星某年所在的星次推测该星次对应国的吉凶.如《国语·晋语四》云:“元年始受,实沈之星也.实沈之虚.晋人是居
期刊
本文章以河北省环保厅近三年环境信息依申请公开数据为样本,分析了近三年河北省环境信息依申请公开的特点、问题、原因,给出了推进河北环境信息依申请公开工作的对策建议,包括
运用层序地层学的原理和方法,结合露头、钻井、测井等资料的综合分析,利用测井标志识别富县-黄陵地区三叠系延长组层序界面。三叠系延长组沉积演化经历了5次周期长、规模大的
最近,中国软件协会中间件分会公布了一组数据,这个数据表明,中间件分会的成员企业较前一年又增长了一倍多,整个行业的销售额已经突破10亿元,作为“网络时代的操作系统”。作为“与
<正>只有富达基金是持续至今唯一的家族控股非上市基金公司。富达反向基金上一次受到国人的关注,是在2014年2月。彼时,余额宝正迅速壮大,一举跻身全球10大基金产品之列,在被
银监会安徽省宿州监管分局针对辖内部分农信社存在的违法违规贷款现象,于2007年度组织开展了一次专项整治活动,并确定2007年为“违法违规贷款专项整治活动年”。经过一年的集
随着城市机动车数量不断增加,社区步行环境质量逐渐弱化。社区步行环境的改造设计是改善居民生活质量、保障社会和谐稳定的重要手段。本文首先对微循环视角下的社区步行环境