论文部分内容阅读
为了提高网页文本分类的准确性,克服传统的文本分类算法易受网页中虚假、错误信息的影响,提出一种基于链接信息的网页分类算法.通过对K近邻方法的改进,利用当前网页与其父网页的链接信息对网页实施分类.用空间向量表示待分类网页的父链接信息,在训练集合中找到K篇与该网页链接信息向量最相似的网页,计算该网页所属的类别,通过实验与传统文本分类算法进行了对比,验证了该方法的有效性.