基于协同过滤的推荐方法的研究

来源 :桂林电子科技大学 | 被引量 : 3次 | 上传用户:zouximu19840420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对互联网时代中信息过载所带来的各种问题和挑战,人类正不断研究和发展不同的新技术,其中个性化信息服务技术独占优势,主要包括搜索引擎和推荐系统。虽然搜索引擎能够基于用户所提供的明确的需求信息,做出针对性的搜索服务,但是由于内部机制的限制,用户参与度高,服务内容局限。而推荐系统的产生能够弥补搜索引擎所存在的不足,通过分析用户历史行为数据,发现用户的兴趣偏好,从而主动生成满足用户需求的信息内容。到目前为止,推荐系统不仅成为了电子商务发展过程中必不可少的部分,而且在其他领域也被广泛应用。推荐系统的核心在于个性化推荐方法,各种不同的推荐技术正逐步受到国内外业界人士的广泛研究与实践,其中协同过滤推荐技术最受青睐。本文在对国内外研究现状分析的基础上,通过探讨现有的个性化推荐的相关理论和技术,主要针对协同过滤推荐技术进行了更深一步的研究。本文首先针对基于内存的协同推荐方法,从数据稀疏性以及用户偏见性的角度考虑,提出一种优化的协同过滤算法。通过建立用户偏好主题向量,间接获取用户之间的相似性,以此克服数据稀疏性对用户相似度计算准确性的影响。同时基于对用户偏见性的考虑,引入贝叶斯重排序算法,建立项目的信任子群,获取用户对信任子群的局部偏见,最后通过加权相似用户对目标项目的评分最终产生推荐,并通过相关实验验证了此方法的可行性。其次,基于用户隐式评分数据针对基于模型的协同推荐技术,从用户兴趣的潜在性以及高时效性业务场景下用户兴趣的不稳定性和时间迁移性的角度出发,提出一种基于用户潜在时效偏好的推荐方法。通过深入分析用户的历史行为与用户潜在兴趣的关系,采用了基于概率主题模型的用户兴趣挖掘方法。同时,结合隐马尔科夫模型对用户兴趣进行实时捕获,发现用户的兴趣迁移序列,最后通过多次实验验证了所提出方法在高时效性业务场景中对于推荐性能的改善。最后,针对基于模型的协同推荐方法在用户显式评分数据集上存在的概念漂移问题进行了扩展,对推荐系统中用户兴趣的动态性和多样性,以及其学习过程对潜在情景变化的敏感性进行进一步研究,综合时间因子对用户潜在兴趣的全局影响和局部作用,提出一种基于概念漂移的兴趣二阶段学习方法。分析了时间因素与概念漂移问题的紧密关系,通过在用户-项目的评分数据集上对用户兴趣的两个阶段的模型学习,证明了此方法在解决概念漂移问题上的有效性,以及对提高系统的整体推荐质量的改进。
其他文献
Ad Hoc网络是一种特殊的无线通信网络。网络中所有节点的地位平等且可移动,无需设置任何中心控制节点,可以通过无线连接构成任意的网络拓扑。这种临时性自治系统灵活方便,对终端
随着国际互联网Internet的发展和普及,需要面对海量的信息资源,信息内容和层次上的多元性和复杂性,特别是从海量的信息中筛选出少量自己需要的有用的信息资源时,人们有时会感
Contourlet变换拥有良好的各向互异性允许每个尺度上有不同数目的方向,很好地表示图像的局部特征,在图像处理中能比小波变换更好地捕获图像边缘信息更好地表示图像特征。图像
随着电子商务/电子政务的发展,网络安全技术日益受到人们的重视。人们需要在网络中为用户提供身份鉴别和权限信息,以保证网络交互的安全。目前,PKI已成为电子商务等网络应用中不
ITU-T H.264/MPEG-4 Part 10 AVC(简称H.264标准)是由ISO/IEC的运动图像专家组(MPEG)和ITU的视频编码专家组(VCEG)组成的联合视频专家组开发的,于2003年正式推出。作为最新一代的视
图的标号问题是图论中的一个重要方面。由于实际应用的不同,产生了各种图的标号问题,反边幻标号和广播标号是其中的两种。本文利用计算机求解结合数学证明的方法对这两种标号问
现今社会信息技术飞速发展,人们在日常工作中会积累大量的多种类型的时序数据。所谓时序数据是指按时间顺序排列的观测值的集合。对于这些大量的时序数据进行分析处理,挖掘其
随着信息化技术的飞速发展,用计算机模拟植物群落生态结构及植物间的相互作用已经成为虚拟现实领域的研究热点。该项研究包含了多门学科,如生物学、计算机技术、统计学等,其
数字签名为数据提供了认证、完整性和不可抵赖性等重要保证,是信息安全的关键技术之一。基于属性的密码体制发展了传统基于身份密码体制关于身份的概念,基于属性的密码体制将身
无线传感器网络集成了传感器技术、微机电技术、分布式信息处理技术和无线通信技术,已成为当前IT领域研究热点之一。由于其网络的自组织、广覆盖、高容错及高精度等固有优点