论文部分内容阅读
随着Internet的不断发展,人们通过Web接触到了大量的数据和信息。现代社会的竞争趋势要求对这些信息进行实时和深层次的分析,但由于Web页面的复杂、而且是无结构的、动态的,导致人们难以迅速、方便地在Web上找到所需要的数据和信息。解决这些问题的一个途径,就是将传统的数据挖掘技术和Web结合起来,进行Web数据挖掘。
使用模式挖掘是Web挖掘的一个分支,它利用Web服务器的日志中的大量数据及其他相关数据集进行分析挖掘,并从中获得有价值的有关网站访问使用情况的模式知识。国内外对Web使用模式挖掘的研究主要集中在对用户浏览路径的研究上,其中,聚类技术常被用来分析网站浏览者对网页的浏览偏好。但是,传统聚类只能将每一使用者浏览路径归类于单一群组中,鉴于此,将模糊聚类应用在Web使用模式挖掘中。有效解决了在分析浏览路径相似程度方面,当用户以完全不同的浏览路径来访问相同网页时,容易产生错误的分析结果的问题。