基于序列模式的Web日志挖掘及其应用

被引量 : 0次 | 上传用户:hyj_jsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网及信息技术的飞速发展,互联网信息资源急速膨胀,人们不能有效选择和消化纷繁复杂的信息,淹没在信息的海洋中,这种现象称为信息过载。目前,人们主要使用搜索引擎来检索Web上的信息资源,但搜索出来的结果不够智能友好,没有考虑用户的兴趣爱好,出现了“数据丰富,知识匮乏”的现象。Web挖掘是数据挖掘在Web上的应用,它从互联网上的信息资源获取知识,已成为当前计算机科学技术的一个研究热点。Web日志挖掘也叫Web使用挖掘,是Web挖掘的一个重要分支,通过使用Web日志序列模式挖掘技术,可从网站服务器的日志文件中挖掘出用户的访问模式,有利于改善Web的结构设计,为站点管理提供决策支持,为用户提供更好的访问体验。本文系统地阐述了数据挖掘、Web数据挖掘、序列模式挖掘、Web日志挖掘的各个过程。因为原始的Web日志包含了大量的噪声数据,若不作处理将影响数据挖掘结果的质量,所以本文首先对日志进行预处理,结合Apache Log Viewer、Microsoft VisualStudio2005等工具以及预处理方法函数对日志进行数据清理和会话识别,为建立数据挖掘模型提供了数据源。然后,采用微软的商业智能挖掘工具SQL服务器分析服务SSAS为实验工具,Microsoft顺序分析和聚类分析算法为数据挖掘算法,对预处理后的数据进行挖掘,并把挖掘出来的结果进行前端展示,得出用户频繁访问的页面栏目及基于序列模式的用户访问路径。接着,本文对挖掘结果进行分析,提出了完善网站的四点建议,并把其应用到医院网站建设中。实践表明,网站的平均流量及页面浏览量得到提高,用户体验提高较为明显。
其他文献
第一章重性抑郁症静息态异常脑功能连接的判别分析研究目的:重性抑郁症(Major Depressive Disorder, MDD)患者存在静息态脑功能连接的异常,这些异常的功能连接能否应用于诊断M
本文运用社会调查和制度分析相结合的方法,针对企业人事代理员工与正式员工同工不同酬、人事代理员工离职率较高、委托代理双方工作配合不协调等现象,从制度与人的行为选择关系
我国大陆范围内分布着各个时代遗留的数以万计的各类文化遗产,是我们先祖留给我们的珍贵财富。然而,这些文化遗产也存在因旅游热负担过重、或资金不足损毁严重、或遭受自然灾害
目前,全球经济持续发展,经济的高速发展带来了对石油需求的快速增长,在过去的20年里,国际原油市场对原油的需求从每日600万桶增长至每日840万桶。原油的输送主要是靠管道输送来实
随着教育改革全面落实,新课程改革全面实施,教师专业发展已成为教育大计的关键。教师是教育事业的第一资源,没有高水平的教师队伍,就难有高质量的教育。教师专业发展状况,影
土地利用/覆被变化(LUCC)研究已经成为全球环境变化与可持续发展研究的重要内容之一,基于遥感(RS)和地理信息系统技术(GIS)跨区域比较土地利用变化也已成为LUCC动态监测的一个重要手
饮食文化旅游资源具有区域历史性、人文艺术性、参与体验性等特征,能满足旅游者对于异质文化的体验需求,具有很好的开发前景。饮食文化旅游产品形式表现为商业产品、景观产品
目的分析云南省马龙县2009-2012年农村孕产妇保健服务开展情况,为提高该县孕产妇保健服务质量、改善母婴健康提供依据。方法对该县2009-2012年农村孕产妇保健服务的各项指标
随着互联网的普及以及网络技术的快速发展,以互联网为工具的商务手段不断创新,为经营者带来了商机,为消费者提供了便利。电子商务时代,网络营销做为网络商务内容的核心一直受到学