推荐系统中的协同过滤算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lixinghui318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,当今时代已经是一个信息过载的时代。为了解决信息过载问题,很多研究人员开始研究推荐系统,对用户的历史行为进行挖掘,对用户兴趣进行建模,对用户未来的行为进行预测。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它有兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。推荐系统中有两个主要的问题;一个是评分预测问题,另一个是TopN推荐。协同过滤是推荐系统中应用最广泛、最成功的技术。本文主要研究协同过滤中的评分预测问题,目的在于提高评分预测的准确度,研究内容包括以下两个方面:第一,针对基于内存的协同过滤推荐,提出一种改进的相似度计算方法。在基于内存的协同过滤中,相似度的计算是核心,它既关系到近邻的选择又影响到评分预测时的加权权重。当评分矩阵比较稀疏的时候,可能会出现以下情况:两个用户之间共同的评分或两个物品之间获得共同评分非常少,但这些共同评分却非常接近,这个时候如果采用根据评分的方法计算相似度,就会获得比较高的相似度,这就导致计算出的相似度过大,不能反映真实的相关程度。本文针对这一问题,提出同时考虑评分数值和共同评分数目的改进相似度,又结合用户-物品评分的隐式反馈,形成新的相似度计算方法。实验结果表明,改进的方法能有效提高预测准确率。第二,根据基于矩阵分解的协同过滤方法,提出一种改进基于内存的协同过滤的方法。矩阵分解模型认为评分预测问题可以转化为用户-物品的评分矩阵的补全问题。在基于内存的预测评分公式中,评分预测基准是用户打分的平均值,或物品得到评分的平均值;而在矩阵分解模型中,bui是表示预测基准,但是,该预测基准分为3个部分,更加的符合实际情况。因此,本文使用基于矩阵分解模型中训练得到的评分预测基准,来替代基于内存中的评分预测基准。实验结果表明,改进的方法可以有效提高预测准确率。
其他文献
信访属于公力救济,具有解决行政纠纷的功能,是除诉讼、仲裁、行政复议外的一项事后救济机制。上访作为信访的一种主要方式,不但属于公民合法权利,还应受到法律的保护。但由于我国社会正处于转型期,各项体制并不完善,诉讼成本高、效率低,群众信“访”不信“法”的心理等原因导致不当上访行为日益增多。当公民的不当上访行为违反了法律规定,妨碍了公共秩序,具有严重的社会危害性,对其进行刑法规制是必要的。本文共分为五部分
人类生命健康的维系与社会的稳定运行离不开医生职业。然而在古代罗马,职业医生的地位并不高。就罗马帝国而言,作为疆域辽阔且人口众多的国度,其在军队和城市卫生等方面皆对职业医生有极大需求。然而在罗马帝国早期一部分作家笔下,职业医生的形象却是偏向负面的。本文主要从社会阶层的角度出发,着重讨论公元1世纪的罗马社会如何看待职业医生群体并构建其文本形象,进而探究职业医生形象与帝国初期社会阶层矛盾的关系。引言部分
G蛋白偶联受体(GPCRs)响应细胞外刺激从而调节多种生理功能。重复或连续的激动剂刺激会导致G蛋白异源三聚体介导的cAMP信号传导迅速返回基础水平,这是GPCR脱敏的一个非常保守
商业银行对于柬埔寨金融部门的发展有着重要作用。然后,柬埔寨商业银行面临着信用风险,市场风险,利率风险,流动性风险和经营风险等困境。信用风险管理的创建对于柬埔寨的商业银行至关重要。因此,银行的风险管理应侧重于如何信用风险管理。本文研究了柬埔寨部分商业银行的信贷风险对财务效率的影响,使用面板数据评估信用风险和银行的可能性。通过建立随机效应面板模型,本研究发现不良贷款率在5%的显著性水平上对银行的盈利能
随着高速率高质量数据业务的普及,对接入网和骨干传输网的带宽要求越来越高。单波长100Gb/s的速率将逐步成为大容量光通信的主流数据传输速率,而色散将成为影响传输质量的一
土地资源是社会发展的保障,是可持续利用的根基,与人们的日常生活息息相关。区域土地资源的承载能力决定着区域内农业生产和城镇建设等人类活动的限度,决定着区域国土空间开发保护格局。在推进社会经济发展过程中,人类无节制的利用和消耗给土地资源带来了沉重的负担。通过区域土地综合承载力评价研究,摸索出提升土地容纳能力的措施,实现区域绿色循环发展。本文以汉中市洋县为研究对象,结合洋县自然资源条件、社会经济发展状况
本文研究了两类生态系统的动力学行为,全文共分为三章:第一章,绪论,介绍了本文的研究背景和主要工作,以及所用到的一些预备知识.第二章,建立并研究了两个企业之间相互作用的
无线移动Ad hoc网络是一种移动、多跳、自组织的系统。网络结构中的各个节点即可以作为数据源节点,也可以作为转发数据的路由器,这一结构模式极易导致网络发生局部拥塞或全局
304/Q235B热轧复合板作为工业中常用的一种不锈钢复合板,它是由基体层(Q235B碳钢)与覆层(304不锈钢)经热轧复合连接而成,这让其兼具基体层和覆层各自所具有的性能优势,因此得到了广泛应用。但由于近些年环境的不断恶化,在酸雨和一些腐蚀性气体的作用下,导致复合板在使用过程中容易与氢作用而产生氢致损伤,会使复合板界面的结合强度大幅降低。为探究氢在复合板中的扩散机理,本文在调研了不锈钢复合板的发
高碳钢连铸方坯是制造高端棒线类钢铁产品的主要母材,其内部碳元素沿拉坯方向分布的不均匀性严重制约了其产品质量稳定性。本研究以82B帘线钢连铸方坯为例,采用灰度分析为主(