论文部分内容阅读
分析了著名搜索引擎Google采用的PageRank算法,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处.改进算法考虑了网页日期这一重要因素,并重新计算网页中超链接对网页的影响.网页结构中蕴涵着丰富的信息,在href、title等标记中文字对网页主题有重要作用,利用结构标记可以辅助判断网页的主题内容.试验结果表明,采用改进的算法可以提高判断网页重要性的准确度.