论文部分内容阅读
本文设计实现了一种Web信息检索系统,面向有特定需求的特殊用户群,采用基于Web站点处理的情报采集策略.先对各站点页面随机采样,提取出包含敏感信息页面的Web站点,再采集敏感站点中的相关页面生成本地敏感资源库.并对库中的文本页面用改进的TFIDF算法分析处理,以满足用户的查询。该系统能够提高Web页面信息的检索精确度和检测更新率,并可据某一专题方向对Web站点进行简单的自动分类。