论文部分内容阅读
在网络文本图像的自动提取过程中,计算机难以直接实现基于高层语义特征的文本图像提取,因此文本图像提取技术的性能很大程度上依赖于底层统计特征的提取。广义归一化图像信息度量(GNPIM)和Lorenz信息度量(LIM)在灰度级上描述了图像的分布,在语义层上反映了图像的内容,是区分文本图像和一般连续色调图像的有效统计特征,作为支持向量机(SVM)的输入向量,可区分文本图像与连续色调图像,从而实现网络中文本图像的自动提取。实验结果表明,基于GNPIM、LIM与SVM的文本图像提取技术能够有效提取网络中的文本图