融合用户偏好和项目关联的协同过滤算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ufo0101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,海量的信息充斥着现在的社会生活,这对信息的生产者和用户来说都是一项巨大的挑战。推荐系统的产生为解决这个问题提供了有效的解决办法,作为信息生产者与用户之间的桥梁,它能够为用户筛选有价值的信息,同时也能够帮助信息生产者把自己的信息推广到对它感兴趣的用户面前。推荐系统的产生离不开协同过滤算法的发展,协同过滤算法是目前应用较为广泛的推荐算法。虽然目前协同过滤算法已经被应用到许多电子商务网站的推荐系统当中,但是仍然存在一些有待解决的问题。本文针对协同过滤算法中相似度计算未考虑实际场景影响的问题,对相似度计算方法做出了如下的改进:首先,提出了基于用户偏好的相似度计算的改进办法。本文针对热冷门物品对相似度计算的影响,采用热门物品惩罚因子来减少热门物品在相似度计算中所占的比重,并将这种因子引入到余弦相似度计算当中;考虑到用户共同评分项目数量对两用户相似度的影响,我们采用杰西卡相关度计算与改进的余弦相似度计算相结合的方式来进行用户相似度计算。其次,提出了基于项目关联的相似度计算的改进办法。针对传统的相似度计算只考虑项目评分,从而导致项目相关度计算不合理的问题,我们采用了项目的评分相似度与项目的语义相似度线性加权的方式来计算项目相似度。然后,将上述的改进办法以加权Slope one算法为载体,将上述提出的相似度计算方式应用到Slope One算法当中,提出了一种融合用户偏好和项目关联的加权Slope One算法UI-Slope One。最后,通过实验确定了上述两种改进方式中的两个参数的最合适取值,以及近邻用户集合的最适合取值。将两个参数代入公式其中,经过试验对比,可以证明,本文提出的改进后的相似度计算办法相对于传统的相似度计算,实验得出的MAE和RMSE值都较低,具有更好的评分预测效果。并且UI-Slope One算法与其它两种针对Slope One算法提出的优化方法相比,具有较好的评分预测效果。
其他文献
目的:观察单味大黄对抗精神病药物所致便秘的临床疗效。方法:通过对单味大黄的使用,观察单味大黄治疗抗精神药物所致便秘的疗效、起效时间、保持大便通畅的时间、以及是否形
采用正交试验设计方法,研究了插穗长度、插穗粗度、插穗处理方法、施肥配方等4个因素对红叶杨扦插育苗生长和成活率的影响,分析了红叶杨硬枝扦插繁育的关键环节和措施,提出了
OSCA(Reduced hyperosmolality-induced[Ca2+]i increase channel)是高渗性门控非选择性的钙渗透阳离子通道,它在感受外源和内源的渗透变化以及调节植物生长发育中起着关键作
随着智能电网建设的展开,电力无线专网的建设受到了越来越多的关注,选择什么样的无线通信技术建设电力无线专网成为了一个关键的问题。通过分析电力无线通信需求,对比TD-LTE2
研究目的:通过分析儿童阻塞性睡眠呼吸暂停低通气综合征(Obstructive Sleep Apnea Hypopnea Syndrome,OSAHS)与变态反应的相关性,探讨变态反应对儿童OSAHS的影响,为儿童OSAHS
<正>我国《企业破产法》第四十六条第二款规定,附利息的债权自破产申请受理时起停止计息。此规定当然适用于主债务人破产情形,但问题在于能否豁免保证人在此期间的债务利息?
会议
十字花科植物自交不亲和性(SI)受S-位点(S-locus)编码的SRK和SCR控制,它们分别是柱头和花粉中的SI特异识别因子。野生型拟南芥不具有SI,而近来通过转基因手段将外源SRK-SCR基
林药资源信息具有明显的空间特征.属性和空间是林药资源信息数据必须具备的二要素a秦岭林药资源空间数据库的主要实体有秦岭环境资源信息、林药资源信息和林药医学信息.应用E
GPS作为"3S"技术中最基础的系统与工具,以其精度高、观测时间短、操作简便、全天候等优点,在众多领域得到了广泛研究与应用。本文在对牛背梁保护区管理现状分析的基础上,就GPS在自然保护区日常管理工作中的应用问题进行了探讨。
日本加藤繁先生六七十年前所著《唐宋时代金银之研究》,是中国货币史研究方面的一部重要著作。本文是阅读此书第三章《宋代金银货币的用途》的札记。对所谓“宋代金银货币的
会议