论文部分内容阅读
高性能网页索引器JU—Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU—Indexer的系统框架,然后描述了索引数据在JU—Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JU—Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间.