中文错别字自动检测初探

来源 :四川外国语大学 | 被引量 : 4次 | 上传用户:vh600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应信息化工业化不断发展的需求,中文信息处理在输入、输出、检索、存储、生成、理解等方面的处理效率均有较大提高。然而,中文文本自动校对研究从开始直至今日,一直是一个亟待突破和解决的难题。由于汉语语言事实复杂,语病类型多样,文本自动校对研究需要分层级进行。本文参照绝大多数学者对汉语语病类型的研究成果,将字体错误类型单独列出来,着重分析错别字的自动检测问题。由于这一自动检测研究需要以理论研究为指导,而理论研究又是一个复杂的过程,需要分期分阶段进行探索、反思、验证。所以,本文将对中文错别字自动检测做初步的探讨,旨在做理论研究的第一步。本文主要分为六个部分:第一部分从宏观上简要概述中文错别字研究现状和成果,分析错别字研究的目的、必要性和研究重点、难点;第二部分从错别字特点、成因等角度分析错别字出错的规律;第三部分、第四部分从汉语汉字本体研究、国内外中文文本检测研究方法和信息处理技术等几个方面分析错别字自动检测研究的可行性;第五部分根据可行性分析,结合汉字出错规律及研究现状和重难点,分析中文错别字自动检测理论研究的研究步骤和流程,为今后错别字自动检测研究提供指导和参考;第六部分为全文总结及展望。
其他文献
1394技术以及Intel等公司联合提出的、基于IEEE1394数字传输系统的内容保护方案的工作原理和基本内容。
现如今经济高速发展,所带来的显著后果即是科学技术进步飞快,促使机电一体化在各大企业越发普遍。机电设备被广泛地应用于很多行业的大型控制设备当中。同时,这就为机电机械
给出一个利用模糊教学方法实现的独居老人行动分析及异常报警系统设计方案.该系统通过设置在住所中的传感器组获取老人的活动数据,引入模糊逻辑的概念,由单片机实现判别老人
办高品质高中适应了当下社会转型的时代需要,是满足人民群众"上好学"的必然要求,也蕴含了教育教学改革的应有之义。我校坚持"一切为了学生的精彩和可持续发展"的办学理念,秉
会议
能够制备shoreA30~shoreD380的聚氨酯(PU)灌封材料.这些航天产品用聚氨酯灌封材料(PUPM)对各种基材优良的粘接性能;固化温度低不损坏电子器件;有合适的固化时间可流到电子元件
1教具装置图(见图1)2仪器特点及用途(1)特点装置简单便携、操作方便、省时省药、可见度高、观赏性强、重复性好。K+离子焰色不用蓝色钴玻璃就可较清晰地观察。
分析了植物分布理论、生态演替理论、生物多样性理论、景观结构理论等城市森林建设的基础理论;基于野外调查资料建立了徐州低山丘陵森林植被分类系统,包括2个植被型组、3个植被