论文部分内容阅读
随着网络的发展,以及用户应用的不断变化,通用的搜索引擎已不能应对各种不同的检索请求。面向主题的搜集系统是针对一个主题,一类网页的搜集系统,即只搜集整个网络的一个特定子集。对目前采用的各种搜集算法进行了研究和评估,确定了一套面向主题的搜集算法。该算法是基于原有搜索引擎实现的,能够有效、准确的进行同主题搜索,根据实现的结果说明基于SVM和统计的面向主题搜集系统的优势所在及其发展的可能性。