基于马尔可夫决策过程的推荐方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:guihuxinxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的到来,网络用户的规模呈现爆发式增长。面对海量繁杂的网络大数据与千差万别的网络用户,如何从海量数据中精准的推荐给用户感兴趣的信息是十分重要的。推荐方法在一定程度上解决了信息过载问题,但传统推荐模型在挖掘数据特性和多样性推荐方面有待改进。为此,本文从挖掘数据特性和多样性推荐方向出发对基于马尔可夫决策过程的推荐方法开展了研究。首先介绍了本课题的研究背景及推荐系统的相关研究,阐述了本课题研究的意义。介绍了交互式推荐系统方法及强化学习的相关理论基础,以及多样性推荐的基本方法。然后,针对无法完全利用数据特性进行推荐的问题,结合强化学习方法提出基于马尔可夫决策过程的序列模式推荐模型(SPRR),将推荐过程建模为马尔可夫决策过程,设计融合序列模式评分的奖励作为交互式推荐的反馈信息,通过对累计奖励回报设计标准化操作来降低策略梯度的方差,实现提高累积奖励较大的推荐轨迹的概率,同时降低累积奖励较小的推荐轨迹的概率,学习更优的推荐策略,实现较好的挖掘数据特性进行推荐。实验表明基于马尔可夫决策过程的序列模式推荐模型合理可行,并取得了较好的推荐结果。其次,针对推荐过程中缺乏多样性的问题,在SPRR模型基础之上做出改进,提出了基于马尔可夫决策过程的多样性推荐模型(DR)。在序列模式推荐模型的基础上,阐述了多样性策略的具体做法,通过在推荐过程中依据相似度阈值,将高度相似的项目删除,降低推荐项目空间复杂度,提高推荐结果的多样性。最后,在公共数据集上的实验表明,所提方法在不同评价指标上均取得较好的推荐效果,并且增强了推荐列表的多样性。
其他文献
高长径比的铜纳米线,在催化、电学等方面都表现出优越的性能和潜在应用价值。目前,国内外的研究主要集中在铜纳米线的制备、性能和应用方面,对形成高长径比的机理研究较少。
研究目的1.运用生物信息学方法分析透明细胞性肾细胞癌(clear cell renal cell carcinoma,ccRCC)中表达差异显著的基因,并获取目的基因。2.对目的基因神经元正五聚体蛋白2(neuronal pentraxin 2,NPTX2)在ccRCC中的表达情况及其临床意义进行初步探索。材料与方法1.ccRCC相关差异基因的生物信息学分析1.1通过NCBI-GEO数据库下载cc
复印机发展迄今已有七十多年历史,产品已由功能单一的黑白模拟复印机发展到如今的多功能彩色数码复印机。随着科技的不断进步,复印机的复印精度和对图像的还原程度不断提高,在给人们带来更高质量服务的同时,也带来了诸如伪钞制造等问题。目前市面上常见的国外品牌复印机均有成熟的纸币识别技术,但由于国外对中国的技术封锁及我国自身研究水平的不足,国产复印机在纸币识别技术领域研究不够深入。因此,需要研究国产复印机纸币识
近几年,我国水生态治理和保护工作在不断深化,流域治理已成为国家水环境保护工作的重点。对于重点流域或重要水源保护地,周边城镇污水处理厂执行的一级A标准已不能满足要求,迫切需要城镇污水处理厂因地制宜地提高排放标准。本文根据城镇污水处理厂尾水的特点,提出了“珊瑚砂曝气生物滤池(BAF)/活性焦吸附滤池”联合作用单元,通过试验研究,分析几种不同工况下反应器对CODCr、NH4+-N、TN、TP的去除效果,
乌拉根铅锌矿位于西天山塔里木盆地西部喀什凹陷西北部,其超过800万吨的铅锌金属储量,成矿过程中需要大于1.15 ×106m3的H2S和巨量的金属来源,矿石硫的生成方式和巨量金属及
丛枝菌根(arbuscular mycorrhiza,AM)真菌是一类非常重要的土壤微生物,能与大多数陆生植物的根系形成互惠共生体,在促进植物营养吸收、增强植物抗逆性、影响和调控生态系统元
随着全球数字化进程的推进,中国国内的电视技术已经基本完成模拟电视向数字电视转变,但是在中东、东南亚、非洲一些贫穷落后地区的电视技术仍然处在模拟信号阶段。目前随着数
随着互联网信息技术的霸主地位的确定,各种数据呈爆炸式增长。分类为处理这些数据的方式之一。早期的数据分类问题多为单标签分类问题,即二分类问题。而近年来多标签数据量急
毫米波太赫兹频段介于微波与红外波段之间,是电磁波频谱中很有研究价值的一个频段,目前在诸如遥感、无线电导航、等离子体诊断、雷达以及卫星通信等许多领域得到了越来越广泛
论文研究了聚苯乙烯负载硒酸催化氧化制备醛类化合物、1,2-二醇化合物和叔胺类氮氧化合物的方法及其机理。研究发现聚苯乙烯负载硒酸试剂具有高效、稳定、易于回收利用的特性