基于概率分类模型的个性化推荐算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:liongliong506
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息过载的时代,用户如何从海量的信息中找到自己感兴趣的内容,以及信息提供者如何精准地为用户提供信息,都是比较困难的事情。个性化推荐系统能够自动跟踪用户的兴趣特征,并精准地为用户推荐可能感兴趣的商品、网页等,从而解决用户获取信息的效率问题。传统基于用户(User-based)和基于对象(Item-based)的个性化推荐算法面临数据稀疏性问题和冷启动问题,在数据稀疏的情况下,推荐系统没有足够的信息为用户进行准确推荐。为了解决个性化推荐中的数据稀疏和冷启动问题,本文将个性化推荐问题看成是一个概率分类问题,结合传统的Item-based算法思想,将用户过去的评分信息作为一个重要的分类依据建模到该分类模型中,并且引入用户信息、对象信息、时间等上下文信息到模型中作为分类依据。在对用户过去的评分信息进行处理的时候,同样可能因相似度不能计算导致算法无法继续的问题,本文采用一种模拟随机填充的方式来解决。本文使用经典的广义线性概率分类方法:Logistic分类方法和最大熵分类方法来对本文的概率分类模型进行学习。先对Logistic分类模型和最大熵分类模型的原理进行介绍,然后通过Logistic分类方法和最大熵分类方法来对前面提到的概率分类问题进行建模,得到基于Logistic的个性化推荐分类模型(LC)和基于最大熵原理的个性化推荐分类模型(MaxEnt)。最后在实际的交易数据集上进行实验,先对本文的LC模型和MaxEnt进行参数调优,然后与传统的算法进行对比,本文的LC模型和MaxEnt模型在该数据集上较传统的算法在准确性上分别提高了4.85%和5.42%。LC和MaxEnt模型在不同稀疏度的数据集上的表现更加稳定。
其他文献
期刊
随着网络用户的角色由感受者向发动者转变,Web2.0技术带来了又一次互联网革新。社交网络迅速发展,并拥有了庞大的用户群。其中,微博服务的各种创新应用进一步缩短了社交网络
随着经济的发展和人民生活水平的提高,人们对于住房品质的要求越来越高,人们需要一个舒适、安全、方便和智能化的居住环境,这为智能家居的发展提供了一个良好的契机。智能化住宅
随着电子商务的快速发展,大规模的并行业务流程日益增多,实例密集型商务工作流已成为一种重要的、广泛的商业应用。由于实例密集型商务工作流数据量庞大,要保证这类业务流程的服
随着中国经济社会的迅猛发展,城镇化建设已迈上新台阶,然而前期快速粗放的城市建设也带来人口急剧增加、城市中心高强度开发、公共空间不断减少、交通拥堵、雾霾频发等问题。大
多异构网是信息物理融合系统(Cyber-Physical System,CPS)的一种基本网络通信模型,是利用网关将多种不同类型的无线传感器网络及其他网络互联互通而组成的组合通信网络。本文对
目的 探讨真核延伸因子-1A2(eEF1A2)基因对宫颈癌细胞增殖、侵袭和迁移的影响.方法 设计eEF1A2基因的siRNA干扰片段分别转染宫颈癌SiHa细胞、HeLa细胞和C33A细胞,实验组包括:
目的 比较新疆地区汉族、维吾尔族正常及2型糖尿病(The type 2 diabetes mellitu,T2DM)个体血清二肽基肽酶(Dipeptidyl-peptidase 4,DPP4)含量,并探讨其可能的影响因素.方法
混合临界系统将不同关键级的实时应用程序集成到统一的硬件平台上,大大降低了系统的设计成本功耗体积质量,但是由此也引发了很多新的调度问题目前,混合临界系统中调度策略研究主
<正>一本关于课程的著作,为什么命名为"教育想象",作者究竟"想象"了些什么?一本讨论课程的书,为什么直接写课程的内容只有三分之一,而且一半以上的内容是在讨论教育评价?为什