论文部分内容阅读
提出了一种基于网络用户行为的搜索引擎SISI(SimilarInterest,Similar access on Intemet).SISI的查询输入是一个Web文档的URL.SISI的检索模型是使用统计的方法基于网络日志中用户对文档的访问频率挖掘相关文档,充分利用了用户在相关文档判定上的潜在意识.模型的假设基础是一组兴趣相似的人访问的文档有可能相关.与传统的搜索引擎相比较,搜索引擎SISI具有系统初始化时间代价小、空间代价小等优点.同时SISI的检索优势在于可以查找那些没有显式相似内容的相关文档,尤其是