论文部分内容阅读
目的提出一种在文档图像中检索汉字的方法,解决快速检索文本图像问题.方法通过对文档图像的版面分割,找到版面上各个图形、图像和文本子区域.根据版面分割后抽取的子区域特征,采用遗传算法的基本思想,对每个文本图像子区域进行快速搜索.无需提取任何字符图像特征,也无需要遍历整个页面就可找到所需要的内容.结果在使用二值图像表达的文档中,也能够达到搜索字符的目的.结论在数字图书馆技术中,实现了搜索文档图像中符号信息内容,为数字资源的检索开辟了一种新的途径.