Web日志会话中识别方法的改进

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:wangwang09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,Web服务的个性化趋势已成必然。数据挖掘就是从大量的数据中提取隐含的、事先未知的、具有潜在价值的有用信息。随着Web应用的高速发展和广泛普及,在Web服务器上收集了大量的Web日志,这些日志记录了Web用户对Web页面的每一次访问的过程,是一种宝贵的信息资源。挖掘Web日志的关联规则,可以掌握网络流量、理解用户访问模式,进一步可利用这些信息来提高Web系统性能,促进对Web站点的系统设计,以及预测未来用户的数量和爱好,最终可以在日益发展的电子商务领域,指导企业明智地进行市场决策。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,从而解决上面提出的各种问题。会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种优化的会话切分方法,即一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,通过判断是否在极大、极小两个阈值范围内来识别会话。根据页面内容、站点结构确定的页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,本文提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。
其他文献
产品营销由卖方市场转变为买方市场,企业经历了以“产品为中心”向“客户为中心”时代的转换。信息技术的使用为企业管理客户带来了极大的方便,但随之而来的是信息时代的数据爆
小学生自律意识的萌芽时期是在小学的高年级阶段,这段时期学生的心理、生理都有了很大变化,独立意识增强,他们渴望展示自己、表达自己,这种心理状态导致学生难以自律,针对课
随着科学技术飞速发展,多媒体技术在教学上应用日益广泛.目前,它以其独特的优势进入了学校课堂,冲击着传统的教学模式,也冲击着每位教育工作者,推动着学校教学的改革,提高教
学校是学生进行学习的主要阵地,也是学生接受德育教育的重要场所.很多学科的教学内容都对学生的德育教育起着重要的作用,思想政治课的德育指向性尤为突出.然而在具体的教学活
为更好地贯彻新课改精神,提高学生的口语表达和交际能力,促进学生的成长发展,本文理论阐释与案例分析相结合,分析了初中英语讲练融合的具体策略,既要注重学生的主体性,又要注
随着我国科技经济一体化进程的不断加深,科技对经济增长的贡献程度不断提高。科技项目评价作为科学技术管理工作的重要组成部分,是推动国家科学技术事业持续健康发展,促进科学技
数学思维方法是初中数学教学的重要组成部分,它比数学知识教学更重要.因为知识的认知是有限的,方法的作用往往涉及整个数学领域.正是由于其广泛的普遍适用性,超越知识的可能
随着我国教学改革进程的加快,小学语文教学也进行了创新和发展,其中小学阅读具有的创新思维能力、理解能力培养的优势,在小学语文的教学过程中得到了重视.随着新课程标准的实
随着internet的不断发展和普及,Web越来越成为人们获取知识和交流信息的主要平台,在教育领域也不例外。然而,伴随着教育资源数字化、网络化的成功,呈指数级增长的海量信息使