协同过滤算法中稀疏问题的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wlck_dong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的普及和应用,电子商务以其成本低廉、便捷、快速、不受时空限制等优点风靡全球。电子商务为用户提供越来越多选择的同时,其结构也变得更加复杂和庞大。一方面,用户面对大量的商品,要找到自己需要的商品变得越来越困难;另一方面,商家也在大量的电子数据中失去了与消费者的联系。个性化的电子商务推荐系统根据用户行为特征为用户提供一对一的服务,帮助用户找到所需商品,从而顺利完成购买过程。商家通过推荐系统能够提高电子商务系统销售,保持与客户的联系,提高用户忠诚度和满意度。   协同过滤是目前最成功的个性化推荐技术之一,它的基本思想是利用用户访问行为的相似性来互相推荐用户可能感兴趣的资源。然而,目前的大多数协同过滤系统面临着数据稀疏性、冷启动和可扩展性三个问题的困扰。其中数据稀疏性问题严重影响了推荐系统的推荐质量。论文针对此问题进行了深入研究,提出了基于粗集的补值算法(IFRS:Improved Fill Miss Values Algorithm Based On Rough Set)和基于相同评分矩阵的补值算法(CMFM:Fill Miss Values Algorithm Based OnCo-rating Matrix)用于解决稀疏性问题。   IFRS算法是一种基于粗集的补值算法,论文根据协同过滤数据的特点设置了阈值ζ用于刷选相似度更高的用户作为补值参考,同时根据实验中的表现情况选择了使用出现频率最高值填补剩余空缺评分。实验结果显示改进后的算法性能明显提升。   CMFM算法是论文提出的一个新方法。该方法中提出了一种新的相似性度量方法,并提出相同评分矩阵的概念来支持该相似性方法。算法通过动态维护的相同评分矩阵,在循环多次的补值过程中始终选择当前相同评分数最多的对象作为补值参考对象,这种做法有效避免了稀疏性问题对补值算法本身的影响。为提高算法效率,论文提出了一个快速动态维护相同评分矩阵的方法,确保了算法的可行性。实验结果证明,CMFM算法不但具有较快的补值速度,而且推荐精度较高。
其他文献
网络的广泛运用推动了分布式计算的快速发展。网格作为分布式计算的重要支撑技术受到广泛的关注,它不仅突破了单个计算机计算能力的限制,而且将分布的资源组织起来,协同地解决大
学位
随着互联网的迅速发展和普及,网络已成为人们生活中不可缺少的一部分。网络中存在着各式各样的信息,这些信息以网页为载体,呈现在用户面前。网页中蕴含的丰富信息为企业竞争
彩铃业务是移动运营商的一项重要增值业务。当前由于彩铃用户普及率趋向饱和,用户活跃性降低,运营商为吸引用户使用和更新彩铃,经常开展各项彩铃营销活动向用户推荐铃音,但由
基于内容的图像检索技术(Content-based Image Retrieval,CBIR)是从20世纪90年代开始兴起的一种新的检索技术,它自动提取图像的颜色、纹理和形状等视觉特征作为索引来进行检
学位
视觉目标跟踪是计算机视觉领域的重要课题。面对跟踪过程中来自自然场景多种复杂变化的干扰,当前视觉跟踪算法由于其普遍采用的模型驱动模式的固有缺陷,算法的准确性和鲁棒性
寻求大型稀疏线性方程组的高效并行解法是当前大规模科学计算中亟待解决的热点问题。Krylov子空间算法是求解大型稀疏线性方程组最流行和最有效的迭代方法之一,其并行计算主要
学位
随着高速网络应用的日益广泛,拥塞控制机制的研究变得越来越重要。拥塞控制至少应该包含两部分:首先是要有源端算法响应路径中的拥塞,动态的调节数据发送速率;另一方面,要有一个中
学位
数学表达式中不仅包含符号,而且还含有由这些符号组成的多种运算结构。实现对此类信息的检索,无疑会有利于为用户提供更加丰富的检索数学信息的途径。本文通过分析La Te X格
频率规划是无线网络优化中的重要环节,规划结果直接影响到通信网络的干扰和性能。在无线网络日益复杂的今天,网络规模不断扩大,小区半径不断缩小,在容量、质量的要求下,频率规划也
学位
随着无线通信技术的发展和便携设备的不断普及,人们对新的移动通信网络的需求与日俱增。作为一种多跳、无中心、自组织网络技术,Ad hoc网络变得越来越重要了。目前其研究工作
学位