基于关联规则发现的Web挖掘

来源 :河海大学 | 被引量 : 4次 | 上传用户:rzq1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和Internet的普及,在各级网站的服务器中的WWW数 据也飞速膨胀。尽管传统的数据库技术和数据挖掘技术已经取得了飞速的发展并 且日趋完善,但由于Web数据其应用的特殊性,使得传统的技术不能直接应用在 Web的信息挖掘中。Web日志数据是记录用户对Web站点访问信息的数据,保存有 大量的路径信息,对这些信息的分析有利于设计人员掌握用户的喜好和访问习惯, 并可以用来对网站的结构进行优化和页面重组。 传统的关联规则技术是从包含一组事务记录的数据库中发现一些事务项目间关系的信息。本文的工作将致力于关联规则的概念引入到Web挖掘系统中,将用 户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的 行为中发现用户的访问模式。 本文在综述关联规则发现、Web数据挖掘分类、研究内容和目前研究现状的基 础上,明确了Web用户访问日志挖掘研究难点在于:如何对原始日志数据进行预 处理;如何设计有效的挖掘算法。针对这两个难题,本文研究及总结了预处理技术,并利用Apriori挖掘算法思想,给出了适合挖掘用户访问频繁路径的类Apriori 算法,并将其应用于实践中。
其他文献
植物造型是有生命的艺术品,它既蕴含着大自然赋予植物的自然美,也具备人类赋予植物景观的艺术美,是硬质景观所不能替代的.正因为具备这样的特性,所以更应该用发展的理念来进
本论文采用基于IP技术的高层次设计方法对PCI总线设备控制器的设计与实现进行了研究,对PCI总线协议做了比较深刻的理解和分析。在该课题的研究中,采用了目前ASIC设计中的高层次
随着我国物流快递数的迅速增加,原有的仓储园已经不能满足实际的需求.作为物流集散点的综合物流园来说,更应该起到设计规划上的带头作用,在人性化规划方面,实用性规划方面以