面向个性化推荐的Web使用挖掘研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:qijisama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的快速普及和迅猛发展,网上信息量的迅速增长,人们面对大量的信息无法选择和消化,这就是信息过载问题。如何在这个巨大的数据集中发现有用的信息成为Internet研究的热点问题。仅采用搜索引擎来检索Web上的信息,未能考虑个体用户的兴趣偏好,因此,研究者提出用Web个性化推荐技术来有效解决这些问题。Web使用挖掘将数据挖掘技术应用于Web服务器日志文件等数据,获得大量用户的访问行为,为个性化推荐提供了方法依据。Web使用挖掘是目前Web个性化推荐中应用与研究的关键技术之一,主要利用Web使用挖掘的相关技术为不同的用户采取适合用户本身的服务策略,提供相关推荐内容。本文针对推荐系统存在的稀疏性问题,提出了基于项目的非邻近序列模式推荐算法(路径加权算法)。首先介绍Web使用挖掘和个性化推荐系统的研究现状和相关知识背景,包括数据挖掘、Web挖掘、Web使用挖掘的概念以及常用的个性化推荐技术。其次,详细的研究和探讨了Web使用挖掘的数据预处理过程,包括数据清洗、用户识别、会话识别等过程。然后,针对推荐系统存在的稀疏性问题,提出一种基于项目的非邻近序列模式推荐算法,采用自制模拟数据与MovieLens数据集分别与基于项目的KNN方法做对比实验。实验证明,在数据稀疏的情况下,基于项目的非邻近序列模式方法有较好的推荐效果。与此同时,提出了基于项目的非邻近序列模式推荐系统模型。最后,对本文的工作做了总结,并提出了基于项目的非邻近序列模式推荐算法的进一步研究内容。
其他文献
随着信息技术的迅猛发展,社会对Web应用系统的需求日益增长。如何快速开发高质量的Web应用系统,以满足社会的需求,已成为当今软件开发领域中的热点问题。在现代Web应用系统开
越来越多的研究表明,长非编码RNA(long non-coding RNA,lncRNA)在许多生物过程中具有重要的功能。而这些长非编码RNA的变异或功能失调会导致一些复杂疾病的发生。目前关于长
随着数字信息技术的飞速发展,海量的多媒体数据已越来越多地融入了人们的日常生活之中,然而如何能够快速有效地从中查找到所需要的信息却是一个严峻的挑战。同时,在多媒体信
随着变电站自动化系统采用以太网进行通信,网络信息安全问题也越来越受到重视。本文依据IEC 61850(变电站通信网络与系统)和IEC 62351(电力系统数据与通信安全)等国际标准确定的变电站自动化发展方向及通信安全需求,分析了目前变电站通信网络所面临的安全威胁及实时性要求,为客户机/服务器通信模型和对等通信模型分别提出了安全认证方案。针对客户机/服务器模型,采用了强口令认证算法SPAS,并结合双
随着计算机技术的飞速发展,数据压缩技术成为解决海量信息存储、传输的关键技术。这种技术可以提高磁盘的有效容量和IO的有效宽带,进而加速程序的执行。数据压缩主要分为有损
生物信息学的主要任务是利用信息处理方法揭示海量生物学数据中蕴涵的生物学意义、探索生命活动的奥秘。生物基因组中存在大量的非编码区序列,这些序列中包含许多未知的生物功
计算机网络速度的提高和应用的复杂化,迫切需要新的技术手段来保证网络的安全,入侵防御系统就这样应运而生。入侵防御系统作为网络安全领域中的主流技术之一,通过多种技术手
本文对地理信息系统(GIS)中领路导航应用系统的设计和功能进行分析,从而构建一个GIS地图信息的数据结构,并且基于此GIS地图信息的数据结构,建立了GIS地图的站点和道路的网络
随着人类基因组计划的顺利完成,生物信息学成为开启后基因组时代的“金钥匙”,其任务就是读懂人类基因组,这一研究的关键就是了解非编码区的信息结构。因此,分析非编码区信息结构
现代信息化作战环境复杂多变,各种信息资源完全分布在应急环境中,如何实时准确的完成各种信号的收集、分析、判断与决策,已成为亟待解决的问题。因此,迫切需要构建一个高度实