基于点击流分析的Web日志挖掘研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:tjhaixin2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文以Web日志中的点击流数据为基础,从统计分析和智能分析出发,引入Web挖掘技术对网站上用户的浏览数据-点击流数据进行概化分析,生成相应的量化规则;并进行浏览兴趣路径的研究,提出了用户浏览兴趣路径挖掘算法。这种算法能准确地反映用户浏览兴趣,而且可扩展性较好。可以应用于电子商务网站的站点优化和个性化服务等。 本文首先介绍了Web挖掘、Web日志及Web日志挖掘的意义和主要任务,接着设计了对点击流数据进行实时预处理的方法和算法。在数据挖掘即数据分析部分,研究和设计了用于数据概化分析的面向属性规约的算法,在分析目前用户浏览模式挖掘算法存在的问题的基础上,提出了支持-兴趣度的概念,设计了网站访问矩阵,并基于这个矩阵提出了用户浏览兴趣路径挖掘算法。
其他文献
用同异分析法对国家第八轮区试的12个甘蔗品系(其中包括2个对照)在云南瑞丽点的表现进行综合分析,结果表明,表现优秀的品系有5个,即柳城03-1137、云蔗05-51、云蔗06-407、云
本文主要内容包含两个部分.第一部分讨论一类具有周期源的退化抛物方程的Cauchy问题解的定性性质;第二部分讨论一类具周期源的退化抛物方程的Cauchy问题解的几何性质.  一.
本论文主要讨论两种运用在线性规划和半定规划中的内点的预估一校正算法。所谓的预估一校正算法就是在“预估”步之后再取一步“校正”步。大多数的路径一跟踪算法仅仅使用“
在临床试验中,当病人序贯来到时,基于人道的考虑,我们总相自适应地为病人在可供择的治疗方案中选择较优的一种治疗方案.在这篇文章中,我们是使势函数在一定的统计原则下达到最大,
两值响应模型是因变量只取两值的回归模型,常见的logistic模型、probit模型等重要模型是两值响应模型的两种特殊的参数形式.两值响应模型在生物、医学、经济和社会数据的统计
学位
框架的概念是由R.J.Duffin和A.C.Schaeffer在1952年引入的.自上世纪八十年代以来,在小波理论的研究中框架概念得到了应用.对于小波理论中常见的函数族,有些已建立起了它们构成
近年来,以点作为造型与绘制的基本元素的方法,在计算机图形学领域内受到研究者越来越多的关注。本文回顾了基于点元表示的图形学的发展历史,并提出了两个在点造型方面的新算法。
关于一类非局部抛物方程组解的整体存在与爆破,论文考虑一类具有非局部源项抛物方程组。借助于上下解技巧,给出了解整体存在和有限时刻爆破的条件,建立了爆破解的爆破速率估计
本文主要研究C中有界域上的逆紧全纯映射理论,全文共分三章。 第一章介绍了关于逆紧全纯映射方面的知识,特别是拟凸域上逆紧全纯映射的知识。概述了时下C中有界域上逆紧全纯