论文部分内容阅读
针对中英混排文档图像中粘连字符分割准确率不高的问题,提出了一种改进的滴水分割算法。该方法以贝叶斯分类器区分字符类型并利用阈值判定粘连字符的存在,利用粘连字符上下轮廓的极值点确定候选粘连分割点,并利用距离变换提取粘连位置的中心线,最终将极值点与中心线共同确定的路径作为滴水算法的分割路径来完成对粘连字符的分割。实验结果表明,该方法解决了准确选择滴水算法的起始位置和字符笔划损伤的问题,有效地提高了分割准确率。