基于WEB日志的用户行为分析与挖掘

被引量 : 4次 | 上传用户:xuanguiqq110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的到来,网络已成为人们获取各种信息和资源的重要途径。商业、企业、政府、教育等机构不断加速在万维网上的数据积累,存储了海量的数据信息。万维网已然成为全世界最丰富和最密集的信息存储及交换的场所。面对如此宝贵的资源,如何分析蕴藏在其中的信息和知识,挖掘用户行为并加以有效利用,是当前互联网企业的关键需求之一。Web数据挖掘旨在运用数据挖掘技术,通过对Web日志和用户行为的分析,挖掘有用的知识及背后的规律模式,从而解决上述问题。本文详细阐述了从Web数据挖掘到用户行为分析的整个过程。主要研究工作如下:1)介绍和分析了Web数据预处理技术,包括数据清理、会话识别、事物识别等关键步骤。分析网页和点击次数的关系,计算关键字和链接之间的相似度,提出一种改进的相似度算法,提高关联规则算法的精确度。2)利用基于聚类分析的方法识别用户行为模式,并在传统的模型中引入时间等因素,检测突发事件,以反映用户兴趣随时间的变化规律。实验结果证明,本文所提出的改进方案能够有效的分析用户意图,挖掘用户行为规律。且与传统的技术相比,其准确度和效率均有所提高。本文所提出的各项改进方案均可以直接或部分修改后应用于不同类型资源的系统中,因此本研究成果具有一定的普遍意义。
其他文献
研究目的:研究Hedonic模型和重复交易模型在土地价格指数编制中的综合运用。研究方法:理论建模和实证研究相结合。研究结果:综合运用两类模型编制出2003—2009年杭州住宅用地
"友善用脑"以人本主义思想为基础,认为"所有的学生都是天生的学习者",为老师、家长提供了切实可行的教育与教学思路与方法,为每一位学生提供了简便高效的学习方法,为学生终身
“古雅”说的内涵源于康德的“机械艺术”论, 王国维运用“古雅”来分析、解释艺术世界或艺术遗产中那些仅凭艺术技巧取胜的独立价值, 较好地说明和概括了那些靠艺术技巧而得以
本文通过随机抽查对潍坊市参与排舞运动的现状进行了调查分析,并采用文献资料法、问卷调查法、数理统计法和逻辑归纳法等从我市居民参与排舞运动的目的性出发,研究了排舞运动
远程会诊系统是网络科技与医疗技术结合的产物,它实现了医疗资源共享,消除了患者就诊地域的限制。随着国内通信技术和医疗技术的迅猛发展,其规模和复杂度也随之不断增加,如何
近几年,我国航天事业发展迅速,随着航天器的研制、发射的日益频繁,其对应的卫星运行控制系统必须配套建设,而针对每颗卫星均重新建设卫星运行控制系统是不现实的。论文主要针
民族关系评估指标体系涉及因素十分庞杂,应当用系统动态分析方法进行跨学科整合。指标体系的框架结构,应当来自总结民族关系现实结构的理论模型;具体指标的遴选,应当遵循科学
论文以构造解析的思路,从几何学与运动学特征入手,研究构造样式的类型与叠加关系。利用平衡剖面的方法,分阶段、期次进行构造复原,恢复伸展量与缩短量。运用变换构造的思路,
在对土地健康概念及其内涵认识的基础上,分析了土地健康是人地关系共荣的表现,也是维持土地永续利用的基本前提,进而提出把维持土地健康作为土地保护的目标,并进一步阐述了把维持
随着软件系统规模的日趋庞大,需求分析和软件内部信息的管理也都日益艰难,软件系统的可靠性、安全性及成本等受到更加强烈的挑战。因此,能够实现需求获取、需求自动建模和规