基于日志的Web访问模式挖掘技术的研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:slie726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展和WWW技术的日渐成熟,越来越多的企业和组织纷纷在网上开展业务.了解用户的访问行为不仅有助于改善Web站点设计、提高Web服务器系统性能,而且能够改进市场决策.如何从大量的用户访问信息中发现用户访问站点的行为成为企业和组织迫切希望解决的问题.传统的数据挖掘技术和Web相结合衍生的Web挖掘技术为有效地解决这一问题开辟了崭新的途径.该文的主要工作是利用Web挖掘技术对Web访问日志数据进行分析和研究,从中挖掘出用户的个性化访问模式.该文首先研究了数据挖掘技术和Web挖掘技术,描述了Web日志挖掘的一般过程和任务;接着对Web日志挖掘的预处理方法进行了研究,提出了无需用户注册或cookies进行用户会话识别的方法,并详细介绍了一种改善预处理结果的方法——Frame页面过滤技术;随后从序列模式角度介绍了访问模式的挖掘算法,给出了问题的形式化描述,提出了识别最大向前访问路径和发现频繁访问路径的算法;最后实现了基于日志的Web访问模式挖掘原型系统.该文探讨的研究工作具有重要的理论意义,设计的原型系统对指导实用的Web挖掘系统的开发具有一定的参考价值,具有实际应用的前景.
其他文献
网络技术的发展使得网络传输的数字产品在没有授权的情况下容易被有恶意的人们随意篡改、拷贝.近几年来提出的数字水印技术可以解决这个问题.该文从三个不同的角度来研究数字
该论文的主要研究内容是不同设备上图像色彩的相互模拟问题.该文的研究来源于中山大学与广州市快美印务有限公司的合作研究课题"色彩处理软件开发研究项目",该文的工作为该项
基于构件的软件复用和开发被认为是提高软件开发效率和质量的有效途径,并在分布式系统中得到了广泛的应用。但是,目前的软件构件技术主要还是着眼于二进制构件和构件实现模型(
本文以国家863高科技项目(863-511-944-019)、2001年北京市自然科学基金(4012005)、2003年北京市自然科学基金、2003年北京市教委科技发展基金、国家旅游局金旅工程项目为科
工作流管理系统是将实际的业务过程转化成某种计算机化的形式表示,通过调用有关的信息资源与人力资源来协调工作流中的各个环节,使之按照一定的顺序依次进行,从而实现业务过
近年来,Web站点的设计和维护是软件产业中的一个研究热点,随着Web站点复杂性的日益增加,Web站点的开发迫切需要良好的方法和过程指导,于是软件工程领域提出Web工程的概念,开
数据处理是化探找油方法的数据重要组成部分,其开发深度和研究水平直接影响着化探方法的持续发展.作者应用研究生学习过程中获得的知识,在参与国家高技术研究发展计划(863计
随着计算机网络、电子商务和办公自动化系统的广泛应用,电子世界将会成为人们生活的一个重要部分,如何解决电子世界中的争端是一个十分迫切的问题.而数字签名可以提供一个完
本文提出了基于FMP模型中的扩展对象模型的界面布局自动生成方法.根据扩展对象模型的描述信息,在界面的特定区域中完成界面自动生成的设计和实现,建立了一种由模型到代码最终
在国际互联网络日益进入人们的日常生活,电子政务、电子商务日渐普及的大环境下,PKI相关技术问题正成为国际上研究的热点问题.而更多的CA认证中心的建立,异构CA认证中心的整