Web日志中用户访问模式挖掘的研究及应用

来源 :对外经济贸易大学 | 被引量 : 1次 | 上传用户:woaibaobei123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘和万维网应用研究是信息时代两大活跃的研究领域,将数据挖掘技术应用于万维网就称为Web数据挖掘。Web日志挖掘是Web数据挖掘的一种,就是运用数据挖掘的思想来对服务器日志进行分析和处理,从网站的访问日志文件中挖掘出用户访问模式,包括关联规则、序列模式等。通过挖掘Web日志可以改善网站的组织结构,监控服务器的工作情况,改善Web应用的系统设计,为用户提供个性化服务。另外,Web日志挖掘中通过分析挖掘用户访问路径的结果可以改善站点的设计,改进市场决策。本文对关联规则及序列模式识别所用的算法进行了深入的研究,比较了不同算法之间的联系与区别,以及各种算法的优势劣势。通过对中俄经贸合作网进行多次的浏览与深入研究,发现了其网站架构、栏目设置及url编号的特点,对网站的栏目设置状况按照不同的级别进行了总结。此外,本文讨论了数据挖掘的预处理技术,并对现有的中俄经贸合作网Web日志数据进行了相应的处理与转换。在深入研究了数据挖掘的相关算法以及中俄经贸合作网现状的基础上,将理论与实践相结合,完成了对中俄经贸合作网2006年1月份的Web日志数据的挖掘工作。通过数据挖掘,发现了用户访问该网站的高频页面、访问时间与栏目之间的关联、及用户访问栏目的先后顺序等的规律。并结合中俄经贸合作网的具体情况,对挖掘结果进行分析,发现了网站设置中的不合理之处,进一步针对存在的问题提出了合理化的改进建议。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
作为电力和自动化技术的领航者,ABB集团计划从ASSAABLOYAB(publ)收购Lorentzen&Wettre,以加强其制浆造纸业务的实力,收购价约为1.19亿美
Water leakage in drinking water distribution systems is a serious problem for many cities and a huge challenge for water utilities.An integrated system for the
在大力建设和谐社会和新农村建设过程中,提高农村人口的素质,解决“三农”问题,从长远来看,教育方式的转变对农村人力资源的发展起着重要的意义。宁夏是一个以农村人口具多的地区
学位
The effect of aeration conditions and pH control on the progress and efficiency of beet molasses vinasse biodegradation was investigated during four batch proce
本文以广州少年儿童图书馆为例,从基藏目录的梳理,图书抽取,到书库预测,图书上架,最终构建了少儿馆基藏书库,形成了特有的藏书体系,以实证研究确保了文献的延续性。
美国退市分众打破资本僵局私募入局江南春面临新风险分众传媒(NASDAQ:FMCN)的私有化终于有了明确信号。2012年12月20日,分众传媒宣布,公司董事会已批准由CEO兼董事长江南春和
随着电子商务的迅猛发展,基于internet的网上支付系统日趋完善和成熟起来,2006年中国网上支付市场规模达到320亿。然而,因网络交易的高隐蔽性和高技术性所导致的网上支付风险问
按照世贸组织的规则,我国在2006年底实现了金融市场的全面开放,银行卡业务是外资银行进入中国银行业务的最早的切入点。如何选择发展模式,以更好地应对挑战,已成为摆在我们面前的