URL排序相关论文
近年来人们提出了很多新的搜集思想,他们都使用了一个共同的技术--集中式搜集.集中式搜集通过分析搜索的区域,来发现与主题最相关......
在现有多种主题爬虫的基础上,提出了一种基于概率模型的主题爬虫。它综合抓取过程中获得的多方面的特征信息来进行分析,并运用概率模......
为了提高主题爬取的采集性能,提出了基于层次语义的URL排序算法。主题爬取过程中引入了层次语义的启发信息,采用层次语义组合排序......