论文部分内容阅读
在已经具有相当高的识别正确率的脱机手写汉字识别系统中,提高相似字的识别率是进一步提高系统整体识别率的一个关键。该文用K-L变换法[1],线性投影法[2]和非线性投影[2]三咱方法对高维汉字向量进行可视化分析,通过相似字和非相似字的对比性实验,总结了高维相似汉字向量的空间分布特点。在此基础上,采用马氏距离作为度量,根据大量的统计实验结果,提出了一种基于维的非均匀收缩的相似汉字边界学习算法。