【摘 要】
:
随着网络的飞速发展,商务网站逐渐增多。如何根据用户的行为习惯,优化网站结构或主动地为用户提供一些个性化服务,成为了困扰网站管理者的主要难题,Web日志挖掘的出现为解决
论文部分内容阅读
随着网络的飞速发展,商务网站逐渐增多。如何根据用户的行为习惯,优化网站结构或主动地为用户提供一些个性化服务,成为了困扰网站管理者的主要难题,Web日志挖掘的出现为解决这一问题指明了新的方向。作为Web挖掘里的一个重要分支,Web日志挖掘已经成为当前研究的热点。Web日志挖掘是将传统数据挖掘技术运用到Web日志中,来发现用户访问站点的行为模式和兴趣爱好,以及分析站点的使用情况。本论文深入研究了从Web日志中挖掘用户频繁访问路径。首先,针对数据预处理进行了深入研究,其中在会话识别阶段引入了页面层次的概念,使页面浏览时间阈值的确定更加准确;随后对事务识别进行了改进,提出了IMFR算法,该算法将路径补全和事务识别合并为了一步,简化了数据的预处理操作。然后,作者深入研究了两类频繁路径挖掘算法,有候选集产生的算法和无候选集产生的算法。其中,重点研究了无候选集产生算法中的WAP算法,并在WAP算法基础上提出了一种改进算法NGCWAP,该算法通过前序遍历号和后序遍历号来跟踪候选序列分布在哪些子树中,从而避免了物理条件树的构建。最后,作者编程实现了一个B/S结构的Web日志挖掘原型系统,系统采用了改进的事务识别算法IMFR和频繁路径挖掘算法NGCWAP来发现用户的频繁访问路径。除此之外,该系统还可以发现一些常规模式,例如,最受欢迎的页面、用户来源等。论文对改进算法及挖掘系统进行了详细的测试,并对测试结果进行了较为详细的分析和总结。
其他文献
随着数字压缩技术和网络通信技术的发展,特别是无线通信技术的快速发展,基于视频的业务已渗透到了许多的领域,而视频信息在无线网络中的传输与处理也成为目前的一个研究热点
Objective To compare the efficacy and safety between Chinese generic imatinib(Xinwei~,Jiansu Hansoh Pharmaceutical Group Co.,Ltd.)and branded imatinib(Glivec~
电力系统无功优化问题包含多个变量,既有连续的也有分散的,同时约束条件较多,优化目标多样,属于混合非线性规划问题,其多目标、多约束、多变量的特性使得优化问题的求解比较困难。无功优化问题的研究对电网的安全、稳定运行具有重要的作用,因此寻求一种求解速度快、质量高的算法对解决无功优化问题具有重要的意义。蚁群算法和粒子群算法均属于群体智能算法,蚁群算法具有较强的鲁棒性和搜索较好解的能力,且其在解决离散的优化
1998年8月8日1点30分,在南冶煤矿-180水平候车室里,完成了检修任务的早班矿工都拥挤在一起,人头攒动,焦急地看着运人皮带缓缓转动,却无一人乘皮带上井。怎么回事呢?8月8日早班,南冶煤矿停产检修。按
莫高窟俗称“千佛洞”,坐落于河西走廊西段的敦煌。它以精美的壁画和雕像闻名于世,有着“东方卢浮宫”之美誉。它的艺术和历史价值毫无疑问地吸引了国内外大量游客慕名前来参观
目的 探讨应用股骨近端防旋髓内钉 ( PFNA) 治疗老年股骨粗隆间骨折的疗效及对机体关节系统功能带来的影响.方法 选取2014 年2 月~2017 年9 月入住我院骨科的老年股骨粗隆间骨
伴随着Internet规模的日益扩大,多媒体数据等有着高服务质量需求的应用数据在网络数据中所占的比例也越来越重,原有网络体系结构中复杂的用户数据传输平台层次结构和缺乏有效
随着海洋探测与开发的不断深入,具有自主导航能力的水下航行器的需求越来越大。在复杂的水下环境中,声纳传感器是自主水下机器人(AUV)重要的感知设备,水下环境探测、目标特征
近年来,随着通信技术、网络技术与控制技术的迅猛发展,引发了一场工业控制领域深刻的变革。控制局域网CAN以实时性好、可靠性高、分布式等特点,在工业生产过程中广泛使用,但
目前,根据用户查询请求,搜索引擎返回的搜索结果与用户需求的相关程度并不理想。本文探讨将推荐技术引入到搜索引擎中,研究一种综合协同过滤推荐技术和信任机制的用户相关性计算