基于PLSA模型的推荐算法研究与实现

被引量 : 7次 | 上传用户:jimmyzcc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网不断的发展,人们获取信息的方式变得越来越方便,但是面对浩瀚如海的网上资源,人们常常感到束手无策甚至恐慌,希望计算机能够更智能更主动的为我们筛选出有效的资源,使我们轻松的获得自己需要的有用信息。在此背景下,个性化推荐技术得到了前所未有的重视,通过对网站信息和用户行为信息等内容,利用过滤筛选、数据挖掘等机器学习算法,让系统主动为用户进行“思考”。协同过滤技术是应用的最广泛且最为成功的推荐算法,其认为用户的行为具有普遍联系性,可以利用用户相互协作的思想来预测用户的兴趣偏好并得到推荐结果。但不易挖掘用户多兴趣特征的缺陷使得协同过滤技术在准确率上存在局限,而且协同过滤技术还存在两个比较难解决的问题,项目冷启动问题和可扩展性,基于存在的这三个问题,本文做了以下几方面的工作,首先本文将潜在语义分析模型运用到协同过滤算法中,通过统计学知识利用用户评分向量空间构建一个潜在向量空间,即用户或项目的特征空间,而不需要利用外部知识,来发现用户的潜在兴趣进行协同推荐。通过概率潜在语义分析模型的引入,很好的解决了推荐系统存在的扩展性问题。此外大量事实证明,单一模型算法并不能精确的反应用户行为并且做出推荐。以基于概率潜在语义分析的协同过滤模型为基础,利用混合推荐的优势,分别将PLSA-CF模型与基于项目的协同过滤算法和基于内容的推荐算法融合在一起。其中基于项目的协同过滤推荐中相似度的计算本文进行了一定的改进,引入两个项目被共同打分的次数;第二个混合算法本文叫做称之为潜在群体回归推荐,如同协同过滤算法一样要使用所有用户评分数据,对用户行为进行评分,又有基于内容的推荐系统的优势,为所推荐的项目提供了推荐的解释被用户很好的理解,并且能对新的项目进行推荐,很好的解决了项目冷启动问题。通过实验结果显示,基于PLSA-CF模型比传统的协同过滤推荐算法在准确度上有了很大的提高;另外所提出的两个混合推荐算法比起单一协同过滤推荐不但在准确性上有着很好的表现,而且能够对新项目进行推荐,并提供了推荐解释,提高了推荐系统的透明度,得到更好的用户体验。
其他文献
本文通过对2010年我国上市公司年报相关信息的统计调查得出:上市公司首席财务官的性别构成中74.75%的人是男性;年龄构成中58.34%的人在45岁以下(含45岁);学历构成中41.62%的
随着亲密关系领域中认知研究的兴起,关系信念成为研究焦点,关系信念的差异引起个体不同的行为模式和关系体验。本研究主要检验不同关系信念如何影响亲密关系质量,不同关系信念如
随着全国城市化进程的加快,城市人口的急剧增加,市民对医疗保障的需求进一步提高。建立一套可靠性高、功能强大的120急救指挥调度系统显得非常必要。本文在调查和分析现有120急
哲学和社会科学研究中都涉及本体论问题。本体论是哲学中的核心内容,虽然在西方哲学史中,本体论研究经历过兴衰,但在哲学研究中的前提核心地位是不可改变的。任何社会科学研究都
目的观察运用离子导入仪进行中药穴位贴敷治疗慢性阻塞性肺疾病急性加重期患者(AECOPD),达到拓宽AECOPD治疗和护理方法的目的。方法将82例AECOPD住院患者,在常规治疗不变的情
针对下一代互联网可持续发展、资源动态适配的需求,并有效解决现有互联网可扩展性、安全性、移动性支持差等问题,本文作者所在项目组提出了智慧协同网络体系结构。本文根据智
科技型中小企业是经济发展的重要推动力,也是科技创新领域最为活跃和最具潜力的群体,但同时科技型中小企业发展过程中往往会遭遇融资困境,制约企业发展。专利质押融资是为了
目的:主要探讨尿路感染对URSL术后并发症(发热,出血,脓毒血症,肾功能损害)的影响,进一步指导临床医生对此类患者围手术期的治疗。方法:本文回顾性分析2011年12月~2012年12月我院收治的
目的探讨拔气管导管松懈气囊的放气方法。方法复苏室的40例全麻插管患者随机分为对照组和实验组,各20例,拔管松解气囊时对照组按1次放气,实验组分3次放气,在放气的过程中观察
针对Super提出的基于知识的部分匹配方法中,直接以坐标值描述部分轮廓的方法容易受形变或扭曲等干扰因素的影响,基于SIFT描述思想提出了一种新的BSIFT轮廓描述子,用于改进Sup