Web日志挖掘中用户会话聚类算法的研究与改进

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:wfn031641lpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的要主工作如下:首先介绍Web日志挖掘提出的背景、研究意义和研究现状,引出该文的研究主题和研究内容;其次概述Web挖掘,探讨Web日志挖掘的可行性和难点所在,特别对日志挖掘的一般过程进行了深入分析和总结;然后以真实的Web服务器日志为例描述日志预处理过程,详细说明了如何从日志中划分用户会话和表示用户会话,并设计了一种合理的方法计算用户会话之间的相似度;再次,提出一种新颖的用于用户会话聚类的算法——基于竞争凝聚的R-RFCM算法,用VisuaIC++实现并作用于经过预处理的用户会话;最后,以两种类型网站的日志为例分析和评价聚类结果,从而证明了该算法的有效性.该文所提出的基于竞争凝聚的R-RFCM算法,在提高聚类的有效性和健壮性方面有一定贡献,不仅在理论上丰富了用户会话聚类的方法集,而且具有实际的应用价值,在分析网络用户的访问模式和提供个性化服务方面具有较好的应用前景.
其他文献
互联网自诞生以来就得到了广泛的追捧,互联网业务也在以前所未有的速度发展.在传统的分布式IP网络应用中,逐渐暴露出了其使用的弊端并逐渐成为业务的瓶颈.为了充分解决在业务
技术创新政策在建设创新型国家战略中发挥着重要的作用,由于中国的特殊国情以及“市场失灵”的存在,技术创新的发展离不开“看得见的手”的调控,政策干预受到了更多的关注。随着
老龄化对社会需求、社会经济发展正在产生重要影响,同时也带来了诸多挑战。其中医疗服务与老年人息息相关,人口老龄化加剧使健康及医疗服务需求急剧上升,而迎接这些挑战可以有多
随着智能终端和网络的广泛覆盖以及电子商务的迅猛发展,阿里巴巴和腾讯等电商企业主导的网络借贷和互联网理财产品酝酿了新生态金融——互联网金融。这些基于电商支付平台的电
近年来,经济的发展,促进我国科技水平的提升.随着科技的发展,移动互联网时代,融媒体应运而生,改变了当今的舆论生态、传统的媒体格局以及信息的传播方式.融媒体增加了人们获
高校是培养和造就高素质人才的摇篮:是认识世界探求真理解决重大科学课题的前沿,是知识创新推动科技成果向现实生产力转化的重要阵地。我们必须站在时代的高度,以“三个代表
随着经济的快速发展,人民的生活质量与消费水平日益提高,消费的形态和理念逐渐显现多元化与复杂性的特征,越来越多的人为了体现社会地位以及满足特定心理而进行炫耀性消费,并且表
该文在对秦皇岛市文化产业进行深入调查研究的基础上,采用规范分析、实证分析与政策分析相结合的研究方法,提出秦皇岛市文化产业发展的对策建议.研究成果可以转化成有效的政
中国航天工业曾取得辉煌成就,但随着改革开放的不断深入,正面临着人力资源方面的更加严峻的挑战,如何在实践中做好人力资源的合理开发和有效管理,是必须而且急需要研究的问题
本文首先分析和概况了企业经营战略研究理论,包括企业经营战略理论和制定,作为全文的理论铺垫.然后分析了胜利石化总厂内部条件,包括胜利石化总厂现状概况、内部优势分析和劣