论文部分内容阅读
笔划代表着汉字的内部特征,笔划穿越次数是对笔划进行全穿越,反映了汉字的整体特征,全穿越在粗分时区分汉字的能力不是太强,增加了二级识别的工作量。除了提取笔划全穿越外还提取笔划半穿越,并把半穿越的次数进行重新组合形成新的特征值。把全穿越和半穿越结合起来作为汉字的特征值,对汉字进行粗分,粗分不能区分的汉字,采用四个角的能量值密度特征对汉字进行细分。实验结果表明了该方法的有效性。与单独使用全穿透方法相比,提出的方法在粗分时区分汉字的能力增强,减少了二级识别的工作量。