融合内容的协同过滤推荐系统

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:a391137182
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着今日头条、一点资讯等流媒体公司的发展,百度、腾讯、中国移动等公司也逐渐重视信息流领域的市场,开始研发各自的产品。流媒体平台的快速发展,文本、图片、视频等多媒体内容信息呈现爆炸式增长。为了使用户更快地获取到其感兴趣的内容,这些公司均不同程度的提供个性化内容推荐服务。基于内容的推荐算法是内容推荐服务的首选算法,但此类算法过于依赖用户历史,缺乏新颖性。因此,为了提升推荐服务新颖性,协同过滤被广泛应用于内容推荐系统中,然而,由于此类算法使用已有的用户对物品的评分数据产生推荐,面临严重的冷启动和评分数据稀疏性问题。为了解决这两类算法所面临的问题。本文聚焦于对内容信息的挖掘和内容与行为数据进行融合,基于此本文的主要贡献包括如下三点。1.提出融合多维语义表示的概率矩阵分解模型,该模型提出了一种新的文本语义挖掘算法,使用胶囊网络提取文本中更多维度的语义信息,然后通过融合胶囊网络与概率矩阵分解,利用用户历史评分与物品文本信息学习用户与物品的隐含关系。在Yelp Dataset,MovieLens-1m和MovieLens-10m等三个公开数据集上评测该模型评分预测的平均绝对误差和均方根误差,表示了该算法能够有效提升推荐准确率。2.提出融合多源异构信息的排序学习模型,其中多源异构信息是指物品图片、用户评论等信息,提出用户内容模型和物品内容模型,将多源内容信息映射为指定维度的内容向量。然后使用概率生成模型将用户和物品的内容向量融入概率矩阵分解,最后使用最大后验估计来求解模型参数,使用坐标下降法交替训练去学习矩阵分解、用户内容模型和物品内容模型的参数。在Yelp,Amazon等两个公开数据集上评测该模型的AUC指标,均表明该模型能够显著提高了用户推荐列表排序。3.提出了融合多源异构信息的召回系统,将本文提出的融合多源异构信息的排序学习模型应用到“咪咕圈圈”视频推荐系统中的召回层,并通过测试表明该算法能够有效提高推荐系统的效果。
其他文献
近年来,局部可修复码(Locally Repairable Codes,LRCs)已经广泛应用于分布式存储系统(Distributed Storage System,DSS)中。通过访问其它最多r个节点来恢复单个故障节点的LRCs具有局部性r。同时恢复任意两个故障节点需要访问的平均节点数量r2直接影响修复带宽、磁盘I/O以及两个故障的数据块的修复过程中涉及的节点数量。本文以LRCs的平均局部性r为
我国的资源现状是“富煤,贫油”,为保证煤炭资源清洁化利用,煤制油成为我国资源战略的一个趋势,煤制油可以解决我国过度依赖进口石油的现状,提高煤炭的利用率,但是随着煤制油项目的扩大,煤制油后产生的废渣占用场地,并且会对生态环境和人体健康造成一定影响,如何无害化利用煤制油炉渣成为急需解决的问题。本文以潞安集团煤制油炉渣为背景,试验利用煤制油炉渣替代传统混凝土中的石灰石和砂子进行新型炉渣巷旁充填材料的开发
作为第三代薄膜太阳能电池之一的染料敏化太阳能电池(DSSC),因其造价低廉、制造工艺简单、光电转换效率高以及绿色无污染等优点而引起了科研工作者的广泛关注。在1991年,Gratzel首次报道了光电转换效率为7.1-7.9%的DSSC。从此,染料敏化太阳能电池走向了新的征程。随着时代的进步,科技的发展,截止目前这种太阳能电池已经实现15%的光电转换效率,但从商业化角度来分析,因为器件中存在的化学稳定
经济快速发展和城市化建设步伐加快,产生大量建筑垃圾和废旧轮胎,处理数量庞大的建筑垃圾和废旧轮胎已成为紧迫的的环境问题。针对目前废旧轮胎资源化利用常用方法存在二次污染严重、能耗大、成本高等问题,以及建筑垃圾侵占土地、污染环境的现状,本文提出废旧轮胎和建筑垃圾岩土工程生态处置与资源化利用技术,通过室内地基模型试验和数值模拟分析,研究废旧轮胎加筋建筑垃圾土地基的力学性能和工作机理,推广该技术在岩土工程中
初任英语教师的教学能力准备度指的是新入职的英语教师所具备的教学能力与教学岗位需求之间的匹配程度。这一问题的研究,对于我国英语教师能力发展、基础教育阶段英语教学质量的提高以及师范院校人才培养模式改进,均有一定的现实意义。本文以3名在江苏省不同小学新入职的英语师范专业本科毕业生为例,通过教学日记、个体访谈、课堂观察和文本分析等定性研究方法进行了案例研究。本文的研究问题是:小学初任英语教师的教学能力准备
我国篮球事业发展迅速,经过二十年的不断改善,在我国CUBA联赛已经成为国内最具影响力的学生体育赛事之一。从CUBA走进国家队、CBA联赛、WCBA联赛的球员日益增多,CUBA赛事的建立与发展,不仅仅对高校篮球运动发展起到了强大的推动作用,同时也对篮球运动市场化发展具有重要的意义。东北赛区CUBA参赛队伍的综合水平在近年来一直保持在全国领先地位。在CUBA赛事发展过程中,赛制改革、宣传力度、运动员体
国际贸易的增长促进了港口集装箱运输的快速发展。随着港口运输规模的增长,对港口城市的交通、环境、城市空间带来了诸多问题,港城矛盾日益突出,已成为制约国内外国际性集装箱港口发展的核心问题。尽管在港口城市针对集装箱运输卡车实施禁限措施可缓解港城矛盾,但是将阻碍港口经济的发展,进而影响港口、区域经济与贸易竞争力。从国内外港口的探索实践来看,建设内陆港是提升港口运营效率、缓解沿海港口城市“港城矛盾”的有效途
粗糙集理论作为可以用来处理不确定性问题的一种重要数据分析方法,能够根据数据对象间的不可分辨关系获取知识而不需要任何先验知识。粗糙集理论为解决软计算问题提供了新的理论框架,在数据挖掘中具有广泛的应用空间。本文在详细阐述粗糙集理论的基础上,深入探讨粗糙集理论在属性约简及模糊聚类中的应用。属性约简和聚类一直是数据挖掘领域中的研究重点。随着计算机技术和通信技术的发展,数据集变得愈加复杂,数据集内部存在着大
随着工业现代化的不断进步,对空调系统的研究逐渐增多,尤其是进入新世纪以来经济快速发展,各种智慧建筑如雨后春笋般拔地而起,各种类型的空调系统使用频率和使用时间也与日俱
导学案是教师结合学生特点,根据教学内容和教学目标为学生编制的具有明确学习目标、学习内容和学习方法的计划方案,在课前阶段投入应用,能够有效提升学生的学习效率和学习效果。农村高中的英语词汇教学,由于教学对象和环境的特殊性,面临着诸多困境。农村学生在英语词汇的学习中往往具有认真的态度和刻苦的精神,但是相比城市高中,学习经验、学习资源的缺失往往导致他们词汇学习的效果并不理想。导学案在高中英语教学中具有十分