论文部分内容阅读
以PDF格式的电子图书为研究实例,首先对PDF图书的结构进行解析,根据不同的解析结果,采用不同的策略对其实现目录范围的匹配检索。主要针对解析后的图片流,引入改型的Adaboost算法,对图片中的内容进行汉字识别,然后检索匹配,这是本文提出的基于图书目录范围的电子图书检索方式,并构建了基于目录的电子图书检索系统。