基于Web的用户访问模式挖掘算法及其应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhouli1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模的迅猛发展以及用户需求的膨胀,互联网的应用已经渗透到各个领域,越来越多的政府,企业以及个人在Internet上发布或查找信息。Internet上充满了文本、音频和视频等多媒体信息,还包括页面间的链接,用户对页面的访问行为等,人们迫切的希望通过数据挖掘技术来发现隐藏在原始信息中的有用知识,但是Web自身的复杂性决定了Web挖掘不能套用传统的数据挖掘的模式,人们便把传统的数据挖掘技术和Inteenet的特点结合起来,形成了Web挖掘技术。 Web站点的服务器日志数据记录了浏览用户对此Web站点访问时的大量路径信息,对这些信息的分析有利于网站设计人员掌握用户的兴趣和习惯,有利于改善Web站点的结构设计、提高Web服务器系统的服务性能。 本文从Web日志挖掘系统入手,通过查阅国内外大量相关资料,就如何高效地挖掘Web日志数据从而发现知识做了较为深入的研究,本文主要工作是利用Web挖掘技术从庞杂的信息中发现用户的访问行为即访问兴趣模式,从而帮助实现个性化的信息服务。 本文首先介绍了一些数据挖掘和Web挖掘的背景知识、概念分类以及具体应用,重点介绍了Web挖掘中的Web使用模式挖掘(即Web日志挖掘),接着,介绍了Web日志挖掘的一般过程,针对Web上特殊的日志数据格式,重点讨论了Web日志挖掘的数据预处理过程。在模式挖掘阶段,重点讨论了如何发现用户的访问兴趣模式,提出了一种基于访问行为的访问模式挖掘方法,引入了选择偏爱度的概念,并在理论和实践两个方面进行了测试评价。 最后讨论了通过挖掘得到的访问模式在个性化推荐中的应用情况,主要思想是根据从服务器日志中挖掘出的兴趣访问模式,预测用户下一步的需要,动态地为其推荐兴趣度最高的兴趣页面,这样可以快速准确地产生个性化推荐结果。
其他文献
流体现象(如烟雾、火焰、云彩、波浪、汽泡、爆炸等)是日常生活中十分普遍的景象。流体模拟广泛应用于电影特效、影视广告、网络游戏等图形学相关领域中,是计算机图形学中一
无线Ad Hoc网络是由移动节点组成的多跳、临时性自治网络,具有不依赖于现有的通信设施、配置快速灵活等特点,在军事和民用领域得到越来越广泛的应用。然而,作为一种特殊形式
印刷电路板(PCB,Printed Circuit Board)是各种电子元件的支撑体。随着技术的不断发展和工业的持续进步,PCB制造技术朝更高密度发展,从而也使其的质量检验成为一件非常困难的
国际民航组织鉴于在新航行系统的实施与发展过程中出现的问题和对未来航行系统的发展趋势,提出了空中交通管理信息服务的自动化、一体化的要求。空中交通管理信息服务的自动
由于金融帐户之间的交易所天然具有的转入、转出方式,具有相互交易的一个交易团体的交易数据通过转入帐户和转出帐户之间的关联,形成了一个交易的网络,可以非常直观的用图的
时间表问题是一类特殊的资源调度问题,广泛应用于学校课程和考试的时间安排、各类大型会议、体育比赛、航班(火车、飞机、轮船等)时刻表的制定等。本文以大学课程安排时间表
飞速发展的互联网带来了海量的信息资源,用户能否从中有效地获取自己感兴趣的资源很大程度上取决于搜索引擎的性能。在面对用户强烈的个性化需求时,通用搜索引擎难以为其提供
中医学信息化研究的主要目的,是通过对中医知识的标准化、规范化处理,促进中医学在世界医学中得到进一步的发展。中医临床知识的研究则是中医学信息化研究的重要组成部分,其中,中
数据分类是数据挖掘中的一个重要课题。近年来研究提出的关联分类(associative classification简称AC)——将关联规则挖掘和分类结合起来,作为一种新的数据分类方法在数据挖
嵌入式系统广泛应用于科技领域和人们生活当中,同时它也在融合着各种先进技术,不断向前发展。无线通信技术的发展为嵌入式系统开拓了广阔的发展空间。无线通信技术在嵌入式系