手写中文地址识别后处理方法的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:letaopangpang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用。语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用。本文针对手写中文地址的后处理,讨论了语言模型的粒度对识别正确率的影响,分析了基于字和基于词的语言模型各自的优点和缺点,并采用了基于词的语言模型,在此基础上提出了加权词图搜索算法。实验证明,在58269条中文手写地址的测试集上,手写地址的整体识别率由原来的28.56%上升到了75.66%.错误率下降了65.93%,大大提高
其他文献
期刊
以草酸铵为沉淀剂,采用共沉淀法制备Nd-Zr O_x载体,用浸渍法负载活性组分Ni-Mo,制备出Ni-Mo-Nd-Zr O_x系列催化剂,考察了催化剂在乙醇水蒸气重整制氢反应中的催化活性。采用X
她叫房子,一个很特别的名字。她是河北珂蓝美容服务有限公司的总经理,也是神奇“魔”斑一次性祛斑技术的创始人。
完善社会主义市场经济体系和转变政府职能是我国“十二五”期间乃至更长时期内,调整收入分配格局的两个根本性方向。财政作为调节社会分配关系,促进公正与公平的物质基础和重要
一个组织要实施ISO14001环境管理标准,首先必须深刻理解标准,然后按照一定的程序采逐步建立环境管理体系。
偶得美国前总统乔治·沃克·布什(George W. Bush)的个人传记《抉择时刻》(Decision points)就断断续续读了下来。这本个人传记不是流水账式的,而是围绕若干重大事件展开
经过全球金融危机的洗礼,经济全球化的趋势更为明显,新一轮以科技创新为主导的国家综合实力的竞争日趋激烈,我国经济在稳步回升发展中对可持续发展的要求也日益突出,特别是依托自
目前在认证领域中仍存在着某些误区,企业在贯彻ISO9000时必须注重其目的性和有效性,否则将难以取得良好的经济效益.
自1986年中国银行发行我国第一张银行卡“长城卡”以来,特别是从1993年起开展“金卡工程”,在城市人口中推广普及银行卡以来,经过20多年的发展,我国银行卡的发卡量迅速增长,银行卡
BASF公司宣布,截至2016年10月,BASF公司、海德堡大学、慕尼黑LMU和hte的联合研究项目正从德国联邦教育和研究部获得约150万欧元(170万美元)的赞助。该项目旨在开发利用CO2选择性