论文部分内容阅读
针对汉字文本分析,提出了一种新的文本特征———空白线特征(BCF)来进行文本投影轮廓生成。在对生成的投影轮廓进行分析之前,应用BCF矢量平滑算法(BVSA)对它进行预处理。处理后的投影轮廓揭示了汉字文本的一个重要现象,就是BCF矢量中间聚集现象。通过统计实验验证,这是一个稳定的现象,也就是说,不同字体、不同字号、印刷体和手写体等等文本风格的不同,都不影响汉字文本的BCF矢量中间聚集现象。应用这个现象对汉字文本进行行分离,取得了良好效果。