利用关联规则增量式更新算法挖掘Web日志

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fxyygs99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网与WWW以惊人的速度迅猛发展,使得设计与维护Web站点的工作日益重要。设计与维护Web站点需要深入分析站点使用情况,使得整个站点结构更加合理,便利用户浏览。尤其是对各类电子商务网站,发现客户浏览的规律从而为用户提供更加个性化的内容关系到网站的生死存亡。Web挖掘将数据挖掘技术应用于大规模Web数据,能够发现有关客户浏览行为的隐藏模式,具有广阔的应用前景。本文针对Web挖掘中的电子商务环境,采用序列关联规则挖掘的方法,提出了一套完整的个性化推荐解决方案,对其中的数据准备、挖掘算法、个性化推荐等阶段都提出了新的见解和方法。① 本文比较系统、完整的分析和论述了数据挖掘技术、关联规则挖掘技术、关联规则的增量式更新算法、Web日志挖掘的方法和Web日志挖掘的体系结构。② 本文针对电子商务环境的特点,研究了数据准备中的数据清理步骤,提出了新的可以提高挖掘效率的清理方法。同时,本文分析了数据准备中的事务识别步骤,针对网络延时的问题,提出了改进的基于时间窗口的事务识别方法。③ 为了满足电子商务网站对关联规则挖掘算法的要求,本文研究了基于支持度排序树的FOLDARM算法,对之进行了改进,提出了序列支持度排序树的概念,并给出了建树算法,使得可以挖掘序列模式。④ 为了更大程度的利用历史的挖掘结果,本文借鉴后备频繁集的概念,在序列支持度排序树中加入了后备频繁集,并给出了改进后的建树算法、挖掘算法和项目更新算法。⑤ 为了及时的体现用户对新增项目产生的兴趣,本文研究了FOLDARM算法的项目更新算法,提出了三种改进的方案。并给出了其中一种的算法。⑥ 本文针对电子商务网站的具体环境,提出了新的基于序列关联规则的个性化推荐方案和基于支持度排序树的个性化推荐方案。同时,本文还根据支持度排序树的特点,提出了进行网站拓扑结构改进的解决方案。
其他文献
该文通过扩展基于P2P模式的JXTA协议集来实现改进的连接机制并成功开发了P2P信息交换和共享系统,利用成员资格服务策略限制和确认加人对等实体群的对等实体身份.使用双向单播
时空数据库管理系统是管理既具有时间属性又具有空间属性的数据集合的数据库管理系统.近年来,随着GPS、GIS以及环境数据管理系统等技术的应用和发展,时空数据库管理系统逐渐
入侵检测是一种新兴的网络安全技术,专门用于检测发生于内部网络的恶意行为,它能与防火墙相互配合工作,防止网络从内部被攻破,为网络提供全面的防护,研究入侵检测技术十分必要。 
本文基于动态模糊逻辑理论,针对多Agent系统中在对抗和非对抗环境中的工作机理,建立了多Agent基于对抗和非对抗环境的协调工作模型,主要包括如下几个方面的工作: (1)基于让步
随着网络大数据时代的到来,知识库作为对网络数据进行存储,组织和管理的一项重要技术,其数量和规模也空前地增加。一方面,知识库的快速增长将越来越多的知识存储到计算机中,让用户
该论文主要由两部分构成,第一部分介绍了嵌入式WEB服务器/浏览器的特点以及国内外目前在网络上运行的主要安全系统,详细介绍了当前最流行的用于WEB系统的安全传输协议—SSL,
随着信息化进程的不断深入,计算机软件的应用已经渗透到人们生产、生活的各个方面。在这种形式下,提高软件的开发效率已经成为当前软件开发人员的一个重要课题。软件复用和构件
知识经济的到来,提出了知识管理.办公自动化系统也发展到了以知识管理为中心的第三代.办公自动化(Office Automation)系统出现了新的需求:与其它系统的集成、流程优化、知识
在以计算机技术、通讯技术相结合的信息时代的快速发展和互联网的广泛应用的形势下,3C(Computer、Communication、Consumer)合一的趋势已经形成,其结果必然就是将计算机工业的
人类所获取的外界信息中有80%是来自视觉的,而且通过视觉获取到的信息是最丰富也是最复杂的。我们人能够很好的看清楚并理解视觉所捕获到的信息,但是如何让计算机看懂并理解图像