论文部分内容阅读
HITS是一种经典的链接分析算法,其主要问题是容易发生主题漂移。针对这一问题,提出了一种改进的算法:MCHITS。MCHITS利用最大流算法对HITS进行改进:首先将root集扩展两层,然后将root中的结点作为种子结点通过最大流最小割算法发现以root集为中心的社区,社区中的页面作为MC-base集。实验结果表明MCHITS提高了查询结果的相关度,减少了主题漂移的发生。