基于用户体裁偏好的跨域迁移推荐模型

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:yayiye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网及其相关技术的发展,人们在享受网络带来的便利的同时,也面临着严重的信息过载问题,在面对海量信息的同时,不仅难以获得对自己有用的信息,也降低了自己的浏览体验。推荐系统是解决信息过载问题的有效手段,它能从用户的历史记录里学习到用户的偏好信息,并基于此预测用户在未来的信息获取需求,做出个性化的推荐。推荐系统不仅大大提高了用户获取有效信息的效率,提高了用户的使用体验,也给使用了推荐系统的企业带来收益的提升。而由于推荐任务的结构性问题,推荐系统往往面临着数据稀疏性的问题和用户的冷启动问题。因此,大量的推荐算法的研究都着力于解决这两个问题。跨领域推荐是解决数据稀疏性问题和用户冷启动问题的有效手段,这类算法是基于用户往往在多个领域都会有交互记录、且这样的交互记录能有效反映出用户的偏好信息这一事实,为了改进目标领域的推荐问题,从其他相关领域中学习知识,并迁移到目标领域,作为目标领域用户-物品交互信息的补充,以此来缓解数据稀疏性问题和用户的冷启动问题。然而,现有的跨领域推荐算法如联合矩阵分解算法,密码本迁移算法,模型的表达能力较弱,无法学习到深层次的复杂用户-物品交互模式进行迁移;CoNet用到了深度网络来学习复杂的用户-物品交互函数,但是只用到交互信息,而更丰富的商品辅助信息等则未被纳入模型。本文针对用户完全重叠场景下的文娱内容商品(如书籍、电影、电视剧)的跨领域推荐问题,提出了一种基于用户体裁偏好的深度协同交叉网络模型(Genre-based Collaborate Cross Network,GCCN),以改进系统在这些领域的推荐性能。具体而言,本文将用户在文学体裁方面的偏好特征,整合进基于深度学习技术的跨领域推荐深度网络中,通过引进交叉网络结构,利用每个隐藏层的迁移矩阵将两个单独的深度网络融合起来,实现了两个领域间信息的双向迁移,并自动从数据中学习迁移模式,以赋予不同特征不同的迁移权重、筛选出有效的迁移信息、过滤掉其他领域的噪声。GCCN模型比单域的推荐模型、只用到用户-物品交互信息的跨域迁移模型CoNet都有显著的效果提升,其中比目前最好的跨域推荐模型CoNet在HR@10和NDCG@10这两个指标上分别提升了约1.6和2.7个百分点。这样的效果提升可以归功于以下几点:1.我们注意到推荐领域的特殊性,文娱商品领域间的不同子领域具有类似的体裁属性,而用户在不同的子领域的体裁偏好特征往往是共享的一即用户的体裁偏好是独立于文娱商品子领域的。我们将这样的用户偏好特征通过一个体裁分类模型提取出来,使用fastText模型提取出商品描述信息的体裁特征,作为物品特征的补充;2.我们从体裁偏好的角度改进了跨域协同交叉网络(CoNet),以更好地对个体的文学体裁偏好进行建模。我们将不同领域的商品描述信息映射到同一个体裁领域中,并与用户-物品交互特征一起输入深度交叉网络中,使得模型不仅能够学习到用户-物品的复杂交互模式,也能学习到用户-体裁的交互特征,从而能够迁移这部分特征改进目标领域的推荐效果。通过在亚马逊数据集上的比较实验,我们评估了GCCN模型的效果。实验结果表明,我们提出的GCCN模型比其他模型都表现优秀,证明了商品的体裁偏好特征有助于对用户偏好的建模,同时,从不同领域学习到的用户的体裁偏好特征能有效缓解目标领域的数据稀疏性问题,从而提升推荐系统的性能。
其他文献
房地产业在我国经济发展中占据重要地位,关乎人民生活及社会稳定,一直是政府的重点监管行业。随着经济发展,投资者在房产领域重金投资,一度出现“炒房热”现象,而真正的住房需求难以得到满足,这种住房需求以一线城市尤甚。一线城市以其领先的发展优势不断吸引人口流入,但房产开发面积受限,住房需求更多要靠二手房屋来满足。二手房市场存在严重的信息不对称,这既增加了买卖双方的交易成本,同时也为政府监管带来困难。在此背
学位
在日常人际交往中,情感一直担任着极为重要的角色。现如今,计算机技术发展到相对成熟的阶段,人工智能的应用使得人们可以与机器进行交互。因此,让机器拥有“情感”或者能理解人类的情感非常重要,也自然成为了如今的一个热门话题。人类经常表达的情感有生气、害怕、高兴、中性、悲伤、惊喜等,而人类表达这些情感时往往涉及很多方面,例如面部表情、发出的声音、肢体语言等。语音信号(人的声音)因为其固有的优势成为情感计算的
学位
我国股票市场是一个很庞大的市场,股票的现金分红中蕴藏着很大的研究价值。证监会近些年来陆续出台的一系列和企业利益挂钩的监督式激励分红的政策,可以增强上市公司的分红倾向和分红力度。但这可能并不是真的由于上市公司良好的经营绩效而自发产生的,不具有很好的持续性和稳定性,不能帮助投资者获得长期且稳定的持续现金回报。本文基于已有文献的研究,利用生存分析可以对时间因素进行分析和推断的这一优越学科特点,尝试性地从
学位
癌症分类预测在生物医学研究领域是一项极为重要的工作,该研究为癌症的诊断与治疗提供重要的依据。随着高通量技术的发展完善,大量的基因表达谱数据被用于癌症的分类研究中。基因表达谱数据是大量基因表达水平的集合,而现代分子生物学表明,癌症的产生与发展与基因突变、抑癌基因功能的丧失等息息相关。因此,基因表达谱数据也成为了癌症分类研究的主要数据来源。从基因角度出发,科学有效地选取少量致癌相关基因,不仅有助于癌症
学位
全面实施预算绩效管理是党中央的重大部署,是现阶段的一项重大变革。2022年政府报告指出,要重点深化预算绩效管理改革,增强预算的约束力和透明度。充分说明在推进预算资金有效运用,高效发挥各个单位的职能作用上,加强预算绩效管理在行政单位中显得格外重要。重视加强预算资金管控,稳步提升预算资金的使用效益,注重结果导向,成本效益,责任约束,以此建立政府权力的制约制度,把权力关进制度的笼子里,防范财务舞弊和公权
学位
扶贫开发四十年,我国减贫工作取得了可喜的成果。然而随着脱贫攻坚的推进,扶贫边际效应呈现递减趋势,脱贫与转贫并存。如何做好脱贫后续发展和转贫防控,不仅关乎精准扶贫工作的成效巩固,而且关系我国全面建成小康社会的质量水准。在现有的成绩上,要巩固脱贫成果,提高脱贫质量,将脱贫攻坚战由“打赢”向“打好”转变,防止转贫至关重要。过去转贫研究集中在贫困人口脱贫后再贫困的返贫问题上,且以定性、宏观及事后治理为主。
学位
经济预测主要是减少不确定性因素对工业经济发展影响的一种科学认识活动,通过对统计指标变化的预测来达到预判行业整体发展速度、质量的目的,而计算同比增长率是衡量统计指标变化的主要方法。统计局在进行行业宏观经济指标的统计时常以规模以上企业为统计范围进行全面调查,而规模以上企业基数是一个变量,不同统计周期对应的规模以上企业存在隐性变动,故对规模以上企业经济增长预测时,必须充分考虑到基数变动带来的影响。本文以
学位
现如今,青光眼是使患者失明的主要眼部疾病之一。从眼底图像中得到的杯盘比指标是诊断这一眼部疾病的重要依据。其中杯盘比是根据图像中划分出的视盘和视杯区域的最大垂直直径计算得到,而这两个区域的精确分割通常需要有多年经验的眼科专家来完成。现实中人工分割效率低下,因此借助模型完成此类分割任务具有很重要的实际应用价值。先前对眼底图像分割模型的研究往往追求在单个数据集上的分割效果。但是,对于由不同眼底照相机得到
学位
随着时代的发展,互联网科技发展突飞猛进,互联网和大数据带来的问题是由于信息过载而导致信息利用率低。在这种情况下,对于推荐系统的研究逐渐吸引人们的目光。推荐系统可以向用户推荐他们可能比较感兴趣的东西,通过进一步探究用户的行为,了解不同用户的个性化需求,把大量的长尾商品推荐给可能对其感兴趣的用户,不仅节省了用户的时间成本,同时也为使用推荐系统的网站本身带来了更多的利益,甚至可以推荐给用户一些他们感兴趣
学位
在世界高速发展的今天,石油作为战略资源其重要性不言而喻。因此确保石油高效、稳定的开采有着重要的意义。在石油开采过程中,结蜡问题一直是一个挑战。数据显示我国原油含蜡量高,据统计,含蜡量超过10%的原油几乎占所有产出原油的90%,而且大部分超过20%。高含蜡量也就意味着更高的结蜡风险,以及更高昂的清蜡成本。因此有效的预防结蜡对原油开采公司有着重要的意义。为帮助原油开采公司探索结蜡规律,预防结蜡问题,节
学位