带物品容量约束的推荐算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xiao959907530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为大数据时代最有效的信息过滤手段之一,推荐系统得到了学术界和产业界的深入研究和广泛应用。一个完整的推荐系统一般存在3方主要的参与者:用户、物品供应商和推荐系统运营商。传统的面向用户的推荐算法通常难以避免物品流行性偏差问题,这极大损害了推荐系统另一方主要参与者—物品供应商的物品推荐公平性需求。本文同时考虑物品供应商和用户的不同需求,开展面向推荐公平性和准确性的推荐算法研究,主要研究内容有以下三部分:(1)提出物品容量限制方案。在常见推荐算法产生的推荐结果中,流行物品被推荐的比例远大于其在历史记录中被交互的比例,这种流行性偏差经过多轮推荐就会产生“富者愈富”的马太效应。因此,提出物品容量限制方案,使得每个物品允许被推荐的次数与该物品的流行度成正比,从而将部分曝光机会从流行物品转移给小众物品,提升物品推荐公平性。(2)提出物品容量限制场景下基于贪心策略的用户-物品匹配算法。由于物品容量有限,因此传统Top N推荐则不再适用。文中提出了基于RSP贪心策略的启发式算法用于解决这一约束条件(物品容量限制)。在单一的RSP算法中,推荐准确率有较大损失,因而提出了两种后处理方法,Post-Normalized和Post-Degree。通过分析以及实验,Post-Degree与RSP算法相结合使其在解决小度用户推荐准确率上有更好的表现,总体推荐准确率得到保证,并且在物品供应商推荐公平性即覆盖公平性指标上也得到了非常好的表现。(3)提出求解物品容量限制场景下基于最小费用最大流(MCMF)的推荐模型。由于单一的RSP算法本身所得到的推荐结果往往不是最优组合推荐,因此引入MCMF模型,将其用于物品容量限制下的推荐,以求解最优组合推荐结果。实验表明,通过MCMF模型进行求解的推荐结果在推荐准确率上也得到了保证,并且在物品供应商推荐公平性即覆盖公平性指标上也得到了非常好的结果。另外,相较于P3类推荐算法,MCMF方法没有引入任何参数,在推荐准确率上与P3类算法有着相当的效果,在覆盖公平性上又有着绝对的优势。
其他文献
行人重识别是在图像库中检索与查询图像具有相同身份的行人图像。目前,行人重识别在智慧城市、刑侦取证、社会安全等领域有着广泛应用。然而,行人重识别需要依赖大规模的有标记的数据集来训练模型,而数据标注的高成本使得基于监督学习的方法难以扩展到现实应用中。因此,如果能在不使用数据标注的情况下,将在其他数据集中训练的模型直接迁移到新的数据集中,将会对极大促进行人重识别技术的商业化进展。本文借助域适应、影响函数
地表上行长波辐射是反映地球表面冷暖状况的指标,是地表辐射收支的关键变量之一。在已有地表上行长波辐射产品的估算算法中,地表均被假设为朗伯体,对地表热辐射方向性的回避会给地表长波上行辐射的估算带来很大的误差。对同一地物进行多角度准同步观测是解决热辐射方向性最直接最有效的方法,然而,目前在卫星尺度只有ATSR系列传感器可以提供两个角度(0°和前向55°)的准同步观测。两个角度不足以驱动热辐射方向性核驱动
湘西土家族摆手舞源远流长,是土家族传统文化的重要内容,在各种节日庆典中发挥着重要作用。虽然湘西土家族摆手舞在当地受到部分人的高度关注,但是在传承发展方面却面临着困境,亟待寻求多条路径予以优化解决。本文立足于舞蹈教育层面,在简要介绍湘西土家族摆手舞的基础上,明确了传承和发展湘西土家族摆手舞的重要性,并重点探讨了如何在舞蹈教育过程中传承和发展摆手舞,希望相关举措具备参考借鉴作用。
随着知识经济时代的到来,知识在生产生活中发挥着越来越重要的作用,为了让知识流动起来消除“信息孤岛”现象,基于区块链的知识共享技术已经成为了当前研究重点。在知识共享环境中共享网络通常地域分布广阔,网络状况复杂并且对工作效率和安全性要求较高。但是由于当前区块链共识算法大多基于同步或半同步网络假设,相应的设计难以应对网络延迟类攻击,并且不能同时保证可伸缩性和安全性,使得基于区块链的知识共享技术难以在应用
基于自然语言描述的行人图像检索研究指的是给出一段自然语言形式的文本描述,从行人图像数据库中检索出与文本描述最相符合的行人图像。随着卷积神经网络和循环神经网络的快速发展,计算机已经具备高效提取图像与文本特征的能力。然而,仅仅提高视觉模型或者文本模型的特征提取能力对基于文本的行人图像检索研究的性能提升收效甚微。由于图像和文本特征分属于不同模态,如何减小不同模态之间的语义鸿沟成为提高基于文本的行人图像检
近年来,由于国家层面对境外融资政策的支持,境外发债迅速成为中资企业特别是地方国企融资方式的新宠。分析中资美元债的发行模式、存在的潜在风险及应对措施,具有现实指导意义。
文本情感分类是一个自然语言处理领域中的常见问题。随着大数据时代数据规模的爆炸式增长,用户在互联网的使用中积累了大量的文本数据,如何从文本中有效提炼出用户的情感倾向成为了如今自然语言处理领域的一大挑战。而文本情感分类方法作为处理该问题的有效方法之一,也因此得到了研究者们的广泛研究。现有的文本情感分类方法主要使用神经网络相关技术及结构以提取到原始文本中的深层特征信息,进而根据提取到的特征完成文本情感倾
泛娱乐产业发展如火如荼,视频压缩作为基础业务,发挥着极其重要的推动作用。视频压缩的核心技术不断更新,但人们对视频的要求不断提高,有限网络带宽与超高视频码率之间的矛盾仍是未来很长一段时期的研究热点。码率控制与率失真优化技术作为视频编码端优化技术,不可或缺。视频转码能力作为视频服务提供商的硬实力的象征,长期以来各大厂商不遗余力地研发提升。为此,本文围绕多路并行码率控制、率失真优化和视频转码三项内容展开
人体动作识别通过分析人体运动数据来判断人体动作的类别,是典型的多分类任务。它是行为分析和理解的重要基础和前提,在人机交互、智能监控、智能运动、医疗保健等领域具有广泛应用,近年来已成为了计算机视觉领域的热门研究方向。根据人体动作的信息载体不同,人体动作识别可以分为视频动作识别和骨架动作识别。前者的信息载体是连续的图像序列,后者则基于光学估计、深度相机、动作捕捉设备或三维姿态估计算法等得到的关节三维坐
目标检测算法通常假设训练数据和测试数据服从相同的特征分布,但该假设在实际场景中很难达到。很多实验已经证明了域自适应方法可以减小域之间的数据分布差异,以获得更好的检测精度。将域自适应方法应用到目标检测网络中来减小域差异,这种方法称为域自适应目标检测算法。使用域自适应目标检测算法可以用于无监督或弱监督目标检测任务,减少数据标注需要的人力物力。本文使用深度域自适应目标检测算法,利用有标注的源域数据和无标