Web日志挖掘技术的研究与自适应Web站点的构建

来源 :天津大学 | 被引量 : 0次 | 上传用户:wpqh918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web的应用和规模快速增长下,把数据挖掘技术应用于Web是-个极具挑战性的研究方向。从Web服务器的日志挖掘中发现有用的,重要的知识(包括模式、规则、可视化结构等),成为数据挖掘与知识发现的又一重要研究和应用领域。本文作者对Web日志挖掘作了系统性的研究,通过对Web日志的挖掘,找出用户浏览页面的关联规则、聚类信息、访问路径等,并把它们应用到Web站点的智能化设计中。所作的工作主要有以下几个方面:1. 本文介绍了Web数据挖掘的基本概念,分类,并给出Web数据挖掘的基本原理,基本方法,并指出Web数据挖掘的用途。2. 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍各过程的主要任务。3. 从Web日志挖掘过程预处理阶段的结果用户会话文件开始,提出了一种基于扩展有向树模型进行用户浏览模式识别的Web日本挖掘方法,并在实验室对该方法进行了简单实现和实际日志数据的测试。4. 推荐是Web个性化服务的核心。提出一种自动分层推荐算法,利用页面分层自动选择最佳的匹配粒度,进行基于频繁导航路径的推荐。实验结果表明,该算法大大减少了在线匹配的开销,可以成功地应用到Web日志挖掘中。5. 提出了一个基于Web日志挖掘技术的应用,即用户自适应的Web站点,介绍了这一系统的实现方法和主要特色。
其他文献
在经济全球化的大背景下,物流行业获得了快速的发展,物流行业呈现出全球化、专业化、信息化等特点。在此趋势下,众多第三方物流公司与第四方物流公司的兴起,促进了物流服务供应链的发展。物流服务供应链是一种新型的供应链,以物流服务集成商为核心,整合能力提供商的物流能力、物流资源来完成供应链实体产品的物流运作任务。物流服务供应链的兴起与发展逐渐引起学者的关注,然而物流服务质量管理则是研究物流服务供应链重要分支
期刊
该文首先对品牌的一些基本概念进行了阐述,同时对名牌产品形象与名牌产品形象识别及产品形象与企业形象之间的关系进行了对比;通过对名牌产品形象识别要素的分析、比较、评价
期刊
期刊
20世纪80年代以来,世界上所有发达国家都己相继建成了国家级的教育和科研计算机网络,并成为这些国家教育和科研工作最重要的基础设施,从而促进了其教育和科研事业的迅速发展
近年来,Internet经历了飞速的发展,用户数量的膨胀和新的应用不断产生,使得网络拥挤问题更加引人注目。由于拥塞控制是确保互联网鲁棒性的关键因素,也是各种管理控制机制和应用的
期刊
在新的长征的道路上,在全党工作重心转移的时候,我们广大新闻工作者回顾过去,展望未来,心中充满了光荣感和责任感。我们的岗位是光荣的,我们的责任是巨大的。粉碎“四人帮”
近年来,随着中国高等教育的深化改革和蓬勃发展,教育成本分担理论得到了全社会的共同认可,于是收费制度开始建立.随着收费力度的逐步加大,高校贫困生的问题凸显而出.为此,国