结合用户聚类的协同过滤推荐算法研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息2.0时代的到来,互联网的飞速发展使得人们获取信息的方式越来越容易,用户在面对海量的数据难以快速而准确的检索到对自己有用的信息,即信息过载问题。个性化推荐系统可以有效的解决信息过载问题,其核心就是推荐算法,而协同过滤算法就是一种研究成熟、广泛应用的推荐算法。推荐系统都会受到数据稀疏问题的影响,主要通过用户相似度计算的不准确性来体现。针对数据稀疏问题,本文从用户预先聚类和用户相似度算法改进两个方面进行了研究,分别提出了SKCA算法和RWDS算法,然后再将两种方法进行融合提出了结合用户聚类的协同过滤推荐算法。从用户聚类的思考出发,引入了物理学中的拓扑势场理论并通过拓扑势值进行用户重要性表示,针对K-means聚类算法需要用户自行确定类别个数这一不足,结合势场的影响因子对K-means算法进行改进提出了SKCA算法。SKCA算法可以自适应的选取聚类中心后计算出聚类结果以及各个类的代表用户,目标用户只需选择最近邻代表用户所在类中进行协同过滤推荐,结合MovieLens数据集与其它几种聚类算法进行对比实验,实验结果表明,SKCA算法可以实现推荐质量的提升。从用户相似度算法改进的思考出发,首先根据用户的评分数据对与用户评分习惯相异的反常评分项给予更高的权值以实现对项目加权,然后在Jaccard相似度仅考虑共同评分项比重的基础上加入共同评分项间差值的考虑以实现对相似度算法的改进,再将两者综合起来提出了RWDS方法。RWDS算法加入了评分的全局表现并充分利用评分的专业意义,结合MovieLens数据集与其它几种相似度算法进行对比实验,实验结果表明,RWDS算法可以有效提升推荐质量。最后,将SKCA方法和RWDS方法进行融合,提出了结合用户聚类的协同过滤推荐算法。通过与传统协同过滤算法和单独的一种改进算法进行对比实验,结果表明,结合用户聚类的协同过滤推荐算法可以有效缓解数据稀疏的影响,提升推荐质量。
其他文献
随着人们生活质量的不断提高,旅游行业迅速崛起,在国民经济中占据着举足轻重的地位。云南省顺应时代的发展,在当前的发展优势下紧紧抓住这个机遇,大力发展旅游业,现已成为国
集成学习是当前机器学习领域研究的一大热点,因其具备显著增强学习机泛化性能的能力和有效解决学习机过学习问题的优点,而备受研究者的关注。本文就是从集成学习的角度来研究图
设计模式定义了面向对象软件系统里经常出现的一组类和这组类之间的关系,以及它们的目的。在过去的十几年里,设计模式被广泛地应用到软件工业领域。另一方面,随着软件系统的规模
随着网络通信技术的发展和互联网信息资源的不断扩大,信息过载现象日趋严重。传统信息服务的出现在缓解了信息过载问题同时因其面向公众的通用性需求特性,无法满足用户的个性
近些年来,人们对于嵌入式系统的应用需求不断增长,使得嵌入式系统的复杂性不断增加,规模不断增大,系统的不确定性越发明显,这些原因都给开发人员带来了新的挑战。传统的嵌入式系统
本文提出了一种基于单张图片的既能保持面部细节特征又能对人脸轮廓进行胖瘦调整的方法。首先,使用自适应的方法从单张图片重建人脸的三维模型。然后导入预先设定的特征点,根
伴随着期货行业的快速发展,期货公司如何真正实现管理手段的信息化、决策管理的科学化,同时满足行业合规性要求成为项重要课题。在当前竞争形势下增强对期货经纪人的管理和控制
随着互联网技术的发展,为更好地承载信息和提升用户体验,网页中的图片越来越多。对于残疾人,特别是视力残疾人,通过辅助工具访问网页时,图片内容的信息获取来源是图片的替代
随着信息技术的不断发展,嵌入式系统联网应用变得十分普及。目前,IP网络及其应用正处于IPv4向IPv6过渡时期,由于IPv6不是向下兼容的,因此IPv4网络应用不能直接过渡到IPv6环境中。
随着目标检测技术的深入研究,目标检测技术的发展呈现出一种由难及易的趋势,从一开始考虑到目标在图像中呈现的形态变化、角度变化等,早期的研究者希望寻找到这样一类特征,它具有