混合协同过滤算法研究

被引量 : 20次 | 上传用户:wsp1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络上的信息资源越来越多。大数据时代同时给互联网用户带来了“信息过载”的难题,传统的资源搜索技术需要用户通过自身知识主动搜索资源,随着网络资源的增加这种方法已经越来越难以满足人们的需求,以“资源搜寻用户”为设计核心的推荐系统技术随之产生,并迅速成为国内外研究热点。协同过滤算法作为推荐系统中最基本和最重要的推荐算法,具有重要的研究价值和应用前景。大量研究表明目前协同过滤算法仍面临着三个主要挑战:(1)降低历史评分中的稀疏性;(2)提高推荐系统的可扩展性;(3)改善新用户和新物品的冷启动问题。基于用户协同过滤算法和基于物品协同过滤算法是两种主要的协同过滤算法。基于用户协同过滤算法有较高的推荐精度,然而稀疏问题和冷启动问题严重影响了该算法的效率;基于物品协同过滤算法在数据稀疏和新用户冷启动情况下表现更优,但是对用户信息的挖掘模式较为简单,大量实验表明基于物品协同过滤算法推荐准确性不如基于用户协同过滤算法。针对上述难点,本文研究了协同过滤算法的相关技术,详细分析了基于用户协同过滤算法和基于物品协同过滤算法。针对两种算法的问题,本文提出了一种混合模式的协同过滤推荐算法,该算法集成基于用户和基于物品两种推荐机制,推荐时根据用户的历史记录动态选择推荐机制。具体的研究工作如下:(1)提出一种推荐模式转换机制,通过该机制混合模式推荐算法在基于用户和基于物品两种推荐机制间转换。考虑到用户评价的主观模糊性,提出了用户历史评价记录的模糊向量转换方法,将评分转换为该物品对用户兴趣历史集的隶属度;引用基于模糊测度的Shapley熵定义了用户历史集不确定度的概念,通过该值度量用户历史集信息量,当信息量不足时使用基于物品推荐机制,当信息量足够时使用基于用户推荐机制,并提出判断信息量是否足够的方法,最后给出处理用户冷启动问题的算法。(2)提出了改进的基于用户推荐算法。传统的基于用户推荐算法在推荐时并没定义用户历史集不确定度,而该值衡量了用户历史物品集所体现的信息含量,当混合模式推荐算法执行基于用户推荐机制时表明用户历史物品集信息含量超过阈值,本文分析了这种情况下更符合用户需求的策略,通过综合用户间相似度与邻居用户的历史集不确定度改进邻居用户权值,最后在Movielens数据集上测试了本文提出的混合模式推荐算法的准确率,验证了该算法的有效性。
其他文献
复合材料螺栓连接接头在航空结构中被广泛使用,接头在实际工况中承受静载荷以及随机载荷的作用,其对应的疲劳问题是相关领域技术人员关注的重点。建立一种有效的随机载荷预测
主要介绍了一种具有广泛前景的二氧化碳中硫化物分析技术——火焰光度法,并通过介绍原理、实例等并与氧化微库伦法相比较得出了该新方法的推广意义。
颅咽管瘤起源于垂体胚胎发育过程中残余的鳞状上皮细胞,由于肿瘤毗邻视交叉、垂体柄、下丘脑和第三脑室等重要结构,与之关系紧密,任何治疗措施损伤这些结构均可导致严重后果
目的探讨内镜潜水技术在垂体外科手术中的应用方法、适应证、疗效和并发症。方法回顾性分析99例内镜下经鼻垂体手术病人的临床资料,均计划采用内镜潜水技术。其中垂体腺瘤91
运动类app目前进入一个蓬勃发展的阶段,据市场调查机构HIS发布报告称,运动及健身方面的应用程序将会越来越受欢迎,其下载量将从2012年的1.56亿次增长至2017年的2.48亿次,增长
目的:考察法可林滴眼液的稳定性.方法:采用紫外分光光度法测定法可林的吸收度,用初均速法对法可林滴眼液的稳定性进行研究.结果:法可林滴眼液的热解反应活化能为 25. 681 kca
目的制备低折射率光固化涂层。方法以全氟十一烷基丙烯酸酯(FA)、甲基丙烯酸三氟乙酯(TRIFEMA)、四氢呋喃丙烯酸酯GM61P00(THFA)和聚氨酯丙烯酸酯(PU)为主要组分,考察各组分用量对涂层
刚入园的小班宝宝,虽然穿脱衣物的本领有高有低,有快有慢,总而言之自理能力相对较弱,而他们的依赖性较强。如何来逐步地发展和提高孩子的动手穿脱衣物的能力呢?需要孩子、家长、教
目前,我国的文化产业产值占我国整体GDP的比重还远远不及国外发达国家水平,还处于较初级水平,有很广泛的发展空间,而且我国文化产业近年来由于国家重视发展迅速,净产值增幅逐年增
目的探讨弥散张量成像(diffusion tensor imaging,DTI)在颅脑病变周围水肿带纤维显示的局限性。方法对21例脑瘤病人术前均行DTI扫描并以弥散张量纤维束成像(diffusion tensor