论文部分内容阅读
Web是一个巨大的信息资源库,在信息爆炸而知识缺乏下,如何从Web中挖掘有用的知识,已经成为目前数据挖掘的热点。HITS算法是进行权威面页挖掘的一种最权威、最广泛的算法。为了有效进行数据挖掘,文章在分析了传统的HITS算法基础之上,提出采用基本集缩减法对HITS算法进行改进过程,通过实验得到了更快,更准确的Web数据挖掘。