论文部分内容阅读
由于汉字形态的复杂性以及书写的多样性,导致学生在进行汉字书写的时候经常会犯一些笔画错误。这些笔画错误包括基本笔画书写错误(stroke production error),笔画顺序错误(stroke sequence error),笔画关系错误(stroke relationship error)等等。通过汉字教学系统则可以自动查找学生书写中存在的错误并提供修改意见,从而帮助学生学习汉字书写。本文的主要研究内容和创新之处如下。本文利用属性关系图(Attributed Relational Graph)分别表示样本汉字和模板汉字。图中的节点用来表示汉字的笔画,而图中的边则表示汉字笔画之间的相互关系。基于汉字存在的结构性特征,提出了细化型空间关系来定义汉字笔画之间结构性的关系。并利用K-means聚类算法来完成对细化型空间关系的分类。这种细化型的空间关系考虑了笔画之间的相对距离,将笔画空间关系的定义重新定位到了更详细的层面,从而能更全面地描述汉字存在的结构信息。同时,利用本文提出的细化型空间关系,能够发现现有研究常常忽略的笔画之间关系错误查找。在样本汉字同模板汉字的笔画匹配过程中发现,当对汉字中的任意一个笔画进行转化操作(平移,缩放等等)后,该笔画同汉字中其他笔画的关系必然会发生变化,这种变化则是通过间隔邻近图(Interval Neighborhood Graph)来体现的。基于本文提出的细化型空间关系,给出了对应的细化型间隔邻近图。图中任意两个相邻节点可以通过简单的转化操作进行相互转化,而通常这个转化操作是被赋予一个固定分值的。通过对手写汉字数据集里的关系转化重要性的分析,本文通过两种方式来给这种转化赋予不同的值。一种方法通过对关系变化的统计分析来定义新的自适应权值的间隔领近图。由于这种方法需要人为地对关系变化结果进行判断分析,从而本文提出另一种改进方法,利用误差反向传播网络(Back-propagation Neural Network)的方法自动地生成自适应权值。基于学生书写汉字存在的不规范性,本文提出的带有容错机制的节点和边操作的匹配定义。通过这些操作完成样本汉字同模板汉字的笔画匹配,进而查找汉字基本笔画错误以及笔画顺序错误。通过与几种同类笔画错误查找方法进行比较,本文提出方法在样本汉字同模板汉字笔画匹配误差率上有了明显下降(下降幅度最小为十个百分点,最大为三十个百分点)。同时,通过对样本汉字笔画错误实例分析,显示本文提出的智能汉字教学系统能比现有汉字教学系统完成更多笔画错误的查找。