基于Web日志挖掘的应用研究

来源 :天津财经大学 | 被引量 : 4次 | 上传用户:hljsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网站的信息量呈指数增长,如何从这些海量数据中抽取潜在的、用户感兴趣的知识是一个非常重要和有意义的课题。Web日志挖掘正是以此为目标应运而生的。Web日志挖掘是对用户与Web服务器在交互时产生的数据使用数据挖掘技术发现隐含的规律性知识,得到用户访问站点的频繁程度和行为模式,从而有利于网站设计人员掌握用户的喜好和访问习惯,改善Web站点结构及页面间的超链接结构,提高站点的服务质量,改进站点性能,更好地为用户提供服务。论文主要从以下几个方面对Web日志挖掘进行分析和研究:(1)提出了基于XML的web日志挖掘数据源模型XWMM提出了一种基于XML的web日志挖掘数据源模型XWMM。该模型提供方便和精确的数据源搜集方式,搜集的数据内容齐全,实现来自访问日志的用户浏览记录和用户对网页操作记录的有机融合,有较高的会话识别精度和性能,支持多维的web挖掘分析。(2)提出了一种基于频繁特征子序列的聚类算法提出了一种基于用户频繁特征子序列的Web日志聚类算法,该算法首先通过构建MNP树改进了WAP算法,产生用户频繁特征子序列及其出现概率集合,然后综合考虑页面顺序,研究了访问序列相似度的计算方法,建立用户访问序列相似度矩阵,从而获得聚类结果集,进而可以通过计算各类的中心,得到用户典型访问序列,能有效地挖掘用户群的访问模式,具有较好的聚类质量和性能,为电子商务个性化服务提供了依据。(3)设计了基于XML的web日志挖掘的原型系统XWMS,并进行了初步实现设计了基于XML的web日志挖掘原型系统XWMS,并进行了初步实现。对系统应具备的功能如数据采集、数据预处理、模式挖掘、挖掘结果处理等涉及到的技术细节进行了详细描述,并将前面研究的模型和算法集成到系统中来,初步验证了模型和算法的合理性和优越性,并具有一定的应用价值。
其他文献
大力培育和践行社会主义核心价值观是新时代坚持和发展中国特色社会主义、实现民族复兴中国梦的重大战略任务.当前,高校应重视并认真挖掘学生社团这一“隐形力量”的时代价值
城市与生活紧密相关,实现美好生活是城市的价值所在.城市管理与生活相互影响、相互促进,是实现美好生活的手段,但从发展的观点来看,城市在发展的过程中势必会不断产生新的问
根据《2015动漫产业研究报告》蓝皮书中的研究,美日韩动漫一直侵占着中国广大的动画消费市场,而国产动漫仅占10%.中国青少年喜爱的动漫作品90%出自国外,我国巨大的动画消费市场
学生党员的培养和发展工作是高校党建工作的基础,是高校育人的重要内容.当前,预备党员和积极分子的党性教育是否能很好承担起育人的重担是值得讨论的问题.本研究通过问卷调研
1996年,是地矿部门加快推进“两个转变”、全面开展“二次创业”,贯彻实施“九五”计划的第一年。一年来,地矿系统的广大干部职工在去年初部张家港会议精神的指导下,进一步解
社区具有一定的社会性,是社会的缩影,也是社会的重要组成部分.良好的社区环境,不仅能够提高群众生活品质,同时还能够促进社会的和谐发展.社会社区本土化模式的建立,是构建良
脑残粉现象,是现代社会的产物.事实上,从心理学角度究其原因,应该归结于“光环效应”和“证实偏见”.本文解释了“光环效应”和“证实偏见”的概念,并分析了光环效应和证实偏
21世纪,伴随着知识经济时代的到来,经济、科技和教育的国际化进程加快,科技经济一体化成为时代发展的主流,知识对经济增长的影响也日益增大。产学研结合技术创新能有效配置科技资源,促进经济发展,提升我国自主创新能力,创建国家竞争优势。国家创新体系的核心是知识创新和技术创新,产学研结合正是知识创新和技术创新的主要途径和必然发展方向,是加速科技与经济快速发展的有效途径,这已经成为世界各国的共识。本文在认真研
文化扶贫是贫困地区农村实现精准脱贫的重要抓手,“文化力量”可以促使扶贫脱贫概念更加丰富饱满,也凸显了扶贫工作的人文内涵,笔者尝试从思想意识方面去找寻致贫的原因和扶
在我国改革攻坚的特殊历史阶段下,新媒体网络渠道的广泛应用,为热点事件的传播提供了契机.大学生群体对于网络热点事件极为关注,表现出活跃的参与热性和讨论欲望,甚至扮演了