论文部分内容阅读
第一部分设计全文检索系统,由三大功能模块组成:索引模块,检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器,索引文件膨胀率、索引影响因子进行测试,在此基础上设计全文检索系统并对检索响应时间进行测试.第三部分指出应关注XML的安全性.