基于用户反馈及其时效性改进的协同过滤推荐算法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:quyeliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化信息高效获取问题在如今信息爆炸的时代日益凸显,该问题已经引起了社会各界的广泛关注。用户对信息的偏好以及时效性因人而异,其中用户行为的隐式反馈能够更准确的反馈出用户的喜好,并且呈现出一定的相关性,故而对用户的不同兴趣偏好构建以及训练针对性的模型,对用户感兴趣的信息做出预测,对于用户高效获取个性化的偏好信息是具有现实意义的。而协同过滤推荐又是当今社会应用与研究最广泛的推荐算法之一,故本文的目标为基于用户兴趣和评分偏好差异自适应结合,构建出一个相对优秀的协同过滤推荐算法模型,对如何为用户精准推荐个性化偏好信息进行研究。传统的基于内容、混合推荐的推荐算法虽然能够在一定程度上提升预测推荐的精度,但是由于其本身的局限性,在处理数据较稀疏、用户的显示反馈较少的情况时,上述方法在预测精度方面的表还现是不够优越。而协同过滤推荐算法在处理稀疏数据时,能够对用户的隐式反馈及关联进行更深度的挖掘,从而达到更精准地预测效果。但是当前的协同过滤推荐算法大多只针对了用户共评分项等反馈对用户画像及关联进行建模,忽略了用户非共评分项及用户行为时效性等隐式反馈信息,在对用户的评分偏好建模时,也没有考虑到用户评分习惯参照系的选取对建模的影响,没有对用户有限的信息反馈做出最大化的发掘及利用从而为用户提供更精准的推荐预测。所以当前的协同过滤推荐算法研究依然存在以下不足:(1)没有充分考虑用户非共评分项对用户的隐式反馈信息进行更充分地挖掘,不能够缓解数据稀疏性;(2)没有充分考虑用户行为的时效性,在对用户兴趣进行建模的时候,应将伴随时间的流逝产生的用户兴趣漂移及项目流行度的衰减纳入考虑,提升推荐的精度;(3)在对用户兴趣建模的时候,应该考虑到不同用户的评分偏好及尺度的不同,相较于官方给出的标准的评分区间,应针对用户个人评分记录进行可信度更高的个性化建模。根据上述的研究情况,本文根据用户行为隐式反馈的特性,在计算用户相似的时,除了考虑用户共评分项的同时,结合用户的全部项目评分,将用户非共评分项引入相似度计算,缓解了数据稀疏性对预测精度的影响;还融合了时间因素,缓解了随时间流逝产生的用户兴趣漂移及项目流行度的衰减对预测精度的影响;结合用户评分的变异系数对用户评分行为偏好差异进行更精准地建模;在此基础上,最后将改进的用户相似度与用户评分行为偏好差异自适应整合为最终的用户相似性,并根据它生成预测结果。本文的主要贡献如下:(1)提出了一种改进的PCC相似性度量(ITPCR)方法,在考虑用户项目评分上下文信息的同时,融入时间因素,缓解了数据稀疏性、用户兴趣的漂移和项目流行度的衰减的影响;(2)提出了一种基于变异系数的方法来对用户评分偏好差异(URP)建模,利用用户历史评分行为作为量纲的来对用户评分偏好进行建模,提升模型的可信度;将改进后的ITPCR相似度与用户评分偏好差异URP进行加权自适应结合为ITPCR全局相似度,并据此生成更精确的预测结果;(3)提出了用户项目评分行为差异系数RD与TD,从结合用户信息与项目信息对PCC相关系数进行改进;利用SIGMOD函数对RD与TD进行指数归一化,构建出改进系数P,并与传统PCC相关系数结合为IMPCC全局性相似度,并据此来提升最终的预测精度。
其他文献
伴随着劳动力市场改革和经济的飞速发展,我国劳动者的人力资本水平不断提升,名义工资和实际工资都有了较为显著的增加。但在另一方面,收入不平等和工资差异也在不断扩大。持续扩大的工资差异引发了国内外的广泛关注。研究工资收入差异可以从不同的角度展开。本论文聚焦职业工资差异。由于女性和非正规就业群体作为劳动力市场中相对弱势的群体受到广泛关注,本论文选择性别和非正规就业作为研究群体,基于住户调查数据并通过实证分
学位
教育作为推动社会科技进步和经济发展的重要因素,受到了政府和人民的重视。十九大提到,保证让每一个孩子享受到既公平而又有质量的教育,更应优先发展教育。而随着生活水平的提高,人们对公共教育资源的需求也显著增加。面对我国的教育资源在各收入阶层之间、城乡之间的分配不均等现状,公共教育支出作为教育资源的重要组成部分,研究其受益归宿的均等化程度,对解决教育公平问题意义重大。本文考察城乡各个收入阶层的公共教育支出
学位
近年来我国慈善事业快速发展、逐渐繁荣,相关法律和管理条例开始得到完善,但仍无法得到公众持续性的信任,捐赠者更关心哪些组织能够更有效的分配物资。慈善组织与营利性的公司、企业不同,它们以使命为导向,其使命在于解决社会问题或追求公共利益,因此,净收入、利润率等财务性指标对其没有用处,其效率重点在于:通过捐赠物资的分配,该组织能够实现的社会价值。本文选择可向公众进行募捐的公募基金会作为研究对象,通过研究其
学位
现有的研究表明,信用增级的途径主要源于抵押品价值、信誉和担保。隐性担保作为一种非正规的担保形式,其对企业信用增级也会产生正向的影响作用,与正规担保不同的是,隐性担保具有或有性,这种或有性决定了银行在给予被隐性担保企业信用增级时必须进行程度控制。银行作为信用增级的授予方,其在实施信用增级程度控制时通常有两个最重要的因素需要考量,一是隐性担保人的偿债意愿,另一则他的偿债能力。在我国现行的国家治理体系及
学位
京津冀协同发展自2015年起被列入国家战略,战略纲要中指出,天津是京津冀发展的航运中心、先进制造业研发基地和金融创新的示范地,在京津冀一体化发展中发挥着重要作用。其中,产业结构是极为重要的一环,需不断优化产业结构,合理调整产业布局。在这种大背景下,研究天津市产业结构特征,对提高天津在京津冀一体化中的地位及作用具有重要的实践意义。本文利用2012年和2017年天津市投入产出表,以及2017年北京市、
学位
自Engle-Granger提出协整概念以来,通过对非平稳经济变量建立线性回归模型去刻画变量间的线性协整关系被广泛应用,线性协整相关理论研究已经非常完善。但是在实际应用中,受变量的波动性和变量间关系的复杂性影响,线性协整模型会有一定的局限性。基于此,各种非线性协整模型相继被提出,应用最广泛的就是通过在非线性回归模型中加入协整因素,从而得到同时涉及非线性和非平稳的非线性协整模型。由于变量在受到经济冲
学位
2015年11月27日至28日我国吹响了的脱贫攻坚战的号角,在“十三五”时期,共有5575万农村贫困人口实现脱贫,使人民真正实现了“两不愁,三保障”的生活;十四五期间更是实现了彻底脱贫,脱贫攻坚取得了成功。虽然国家对于发展不平等的相关问题给予了一定的措施和手段、也出台了相关的政策,但针对我国的医疗、教育、社会保障等公共资源配置的问题还应该予以特别关注。因此为了弥补市场的失灵,解决资源配置、收入分配
学位
人力资本作为一种社会投入资本,对社会技术进步和区域经济增长有着至关重要的作用。人力资本的空间配置及其循环流动,不仅深度影响各地区经济增长可持续性,对充分发挥中国市场优势和内需潜力也具有深刻的现实意义。合理测度我国省际人力资本流动的空间分布及变化趋势,有效揭示省际人力资本流动状态,进而剖析人力资本流动对各省经济增长的影响,在省际循环视角下根据异质性分析给出数据参考和相应对策建议,对打造新形势下国内大
学位
公共投资是一个国家经济快速发展的重要推动力,提高我国各省区公共投资效率是提振经济、改善民生的必然要求。这些年来,我国在不断的发展进步,但是,回看我国的发展方式,地方政府盲目追求扩大投资规模,造成了一系列问题,进而阻碍地区社会经济的持续良好发展。十九大对于经济发展阶段提出新的要求,意味着要将通过扩大投资拉动经济增长的模式转变为减少投资提高效率的模式。在此背景下,客观公正地评价我国各省区公共投资效率问
学位
近年来,债券市场风声鹤唳违约不断,密集爆发的债务违约事件引起了债权人、投资者以及社会公众的高度注意,仅2020年,就一共有150只债券发生债务违约,金额高达1,697.02亿元。债务违约事件的爆发增长趋势不仅会给企业的良好形象和生存能力带来不利影响,更会拖经济市场发展的后腿,因此企业不断增加的债务违约风险成为亟待解决的急迫问题。而股利平稳性作为体现企业经营状况和盈利能力的重要因素,从股利信号传递角
学位