基于Tomcat日志挖掘的个性化系统原型设计和实现

被引量 : 7次 | 上传用户:huishouzhong2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,国内有大量的基于J2EE技术的网站系统投入运营,但是大部分的网站系统在设计和开发的过程中没有考虑用户可能因为网站信息资源过多而找不到信息的问题,同时也造成了例如像Tomcat等Web服务器所记录的日志信息没有得到充分利用的“资源浪费”问题。为了能够整合和解决这些问题,本文研究了Web使用挖掘理论,以Tomcat服务器的Web日志记录做为研究对象,对Web使用挖掘过程进行系统性分析和研究,在网站系统的设计和开发阶段引入Web日志挖掘技术为用户提供个性化服务,以达到提高用户获取信息质量的目的。本文主要是围绕个性化系统原型的设计与实现工作展开的,取得以下的研究成果:1)在总结国内外关于Web日志挖掘的研究现状的基础上,探讨了Web日志挖掘的数据预处理的相关问题,对Web日志数据预处理的过程:数据清理、用户识别、会话识别、路径补全和帧页面过滤等五个部分进行了深入的研究和论述。在数据预处理的实现上设计了适合本文所设计系统的具体方案,并且对用户识别和路径补全的方法进行了适当的改进,简化预处理的难度,以提高编码实现的可行性。2)在Web日志预处理的基础上,设计了一套基于Tomcat日志挖掘的个性化系统的设计方案。方案分为总体设计和详细设计。总体设计对个性化系统的构架进行了部署和规划,按照实际功能将系统分划为在线和离线两个部分。离线部分做为系统的核心,根据数据在系统中各个任务阶段的功能和形态又将其划分成了数据准备模块、数据挖掘模块和可视化模块。数据准备模块主要完成数据的收集和预处理任务;数据挖掘模块主要完成用户模型算法和挖掘模型算法的存储、数据挖掘和挖掘结果存储等任务;可视化模块主要完成对用户进行个性化的数据匹配和结果展示等任务。详细设计对这三个模块的具体实现方案做出了详尽的论述,给出了本文具体实施系统原型的细节和方法。3)按照本文设计的设计方案,利用Java程序设计语言编写代码,对日志预处理方法和挖掘算法进行了实现,并对实验日志数据进行了实验和分析,然后采用JSP动态页面技术和AJAX技术迅速部署和实现了一套Web新闻信息管理系统,最后根据本文设计的个性化系统原型的实施方案,将日志挖掘的代码和成果无缝集成到该系统中,完成了本文个性化原型的实现任务,证明了本文设计方案的可行性和有效性。
其他文献
2004年8—9月,考古人员在安阳市王古道村发掘出两座保存完好的周代贵族墓葬。研究表明,它们的下葬年代很可能在西周末或春秋初年,墓主应是卫国的“士”级贵族,其中M2为男性,M1为女
以乌拉尔甘草种子为材料,采用近红外光谱结合定性偏最小二乘法对244粒种子(硬实种子和非硬实种子比例为1:1)的硬实性进行了鉴别研究,并特制一样品杯用于单粒种子的光谱采集,以降低
近年来,供应链金融作为企业之间的一种关系行为逐渐成为解决中小企业融资难题的有效方式。在这样的背景下,通过构建中小企业在供应链网络中的双元关系与创新能力影响供应链融
用循环伏安法在玻碳电极上电聚合一层稳定的亚甲蓝聚合物膜,研究了这层膜在0.1 mol/L磷酸缓冲溶液(pH 7.0)中的电化学性质.用纳米金溶胶与聚乙烯醇缩丁醛(PVB)构成复合固酶基
报表是信息管理系统中重要的组成部分,是实现系统分析、决策的必要保障。目前国内外已经有很多的表单与报表生成工具,但是存在价格较高、使用难度大、可重用性差、不易集成到
目的:近年来,随着广谱抗生素、皮质类固醇以及免疫抑制剂的广泛应用,先进诊疗技术如器官移植等的推广,以及肿瘤放、化疗的影响,真菌感染无论是在发生频率还是在致病菌种方面
本课题采用文献资料调查研究方法,问卷法、特尔斐法、小型座谈会等方式,广泛细致地了解了不同人群对奥林匹克文化传播的认识,及其对我国奥运文化战略的一些基本看法,进而便对
随着人们生活水平的不断提高,人们的生活日益丰富。为了满足人们的生活需要,各区域的城市应着重关注自身的建设发展水平。而对于人们而言,输水方式则是城市建设的一大重点问
房地产行业属于资本密集型行业,具有高投入、高收益、高风险的特点。近年来,随着房地产业的飞速发展,房地产投资项目日益增加。为了避免出现盲目的投资行为和不必要的经济损
详细地介绍了近年来化学合成型可降解材料常用的几种改性方法,并简单分析了各改性方法的利弊。对化学合成型可降解材料的改性研究具有一定的参考价值。
期刊