论文部分内容阅读
Web目前是一个巨大的、分布广泛的、全球性的信息服务中心,Web挖掘不仅仅是数据挖掘算法在Web数据上的应用,同传统的数据库数据相比,Web数据具有其特殊性,其特点就是数据没有严格的结构模式、含有不同格式的数据(文本、声音、图像等)、面向显示的HTML文本无法区分数据类型,并且存在大量的冗余和噪声,同时Web是一个动态性极强的信息源,所以面向Web的数据挖掘研究极具挑战性.本文对Web挖掘的特征进行了分析与研究.