个性化推荐中协同过滤算法的改进研究

被引量 : 0次 | 上传用户:fdsth5x1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐技术是解决信息化时代中信息过载问题的有效工具,它在作为一种独立工具帮助人们解决难题的同时,也可以与现有的一些技术如搜索引擎,分类目录等相结合,使它们提供的服务锦上添花常见的个性化推荐技术有基于内容的推荐,协同过滤推荐,混合推荐技术等,协同过滤技术则是其中应用最成功的一种方法它主要是基于用户或物体的社会属性特征,通过分析用户的历史行为产生个性化的推荐由于推荐过程仅需要考虑用户的历史行为,与物体的内容属性无关,实现非常简单,在电子商务,个性化阅读,搜索等领域得到了广泛地应用,因此对协同过滤算法的研究具有很好的商业价值但协同过滤算法在应用过程中也面临着许多问题,如算法的可扩展性,冷启动问题,推荐精度等,它也值得我们进行深入的研究目前学者在如何提高协同过滤算法推荐精度问题上的研究主要集中在相似性计算方法的改进来有效度量用户或物体间的兴趣一致程度,根据数据集的特性选择合适的惩罚因子来提高相似性的准确度,以及通过与其他推荐方式结合以提高推荐精度但是这些方法都忽略了协同过滤算法中近邻用户/近邻项目组的选择,由于最终的推荐都是基于近邻用户/近邻项目产生的,因此它们的质量也直接决定了推荐结果的精度,文中通过实验验证了这一点针对近邻用户/近邻项目组的选择策略,本文进行了详细的研究:首先,文中提出了两个近邻评估指标:近邻用户/项目组相似度和参考近邻比例,来度量近邻的质量通过实验找出了传统协同过滤算法计算过程存在的弊端其次,传统的协同过滤算法选择的近邻要么是相关性比较强,但并不能参与到预测的计算过程,要么就是能参与到预测的计算过程,但是近邻组与目标用户/项目的相关性又不高,导致选择的近邻对预测的计算并非都有正向的促进作用针对原来近邻选择的不足,本文提出了双重阈值的近邻查找方法,在考虑近邻相关度的同时还考虑了近邻参与计算的比例并且将此近邻查找方法分别应用在了基于用户和基于项目的协同过滤算法中,形成了DT-UBCF和DT-IBCF算法然后,基于双重阈值近邻查找法的思想,文中提出了抽样近邻查找策略,提高了基于用户的协同过滤算法应用在在线推荐中的推荐精度最后,在Movie lens数据集上验证了改进的协同过滤算法,实验结果表明DT-UBCF和DT-IBCF的推荐精度都比传统的UBCF和IBCF的推荐精度要高
其他文献
列宁首创了社会主义国家对外开放的理论,他在吸收马克思、恩格斯“世界历史”理论后,发展、实践了对外开放理论,列宁关于经济文化落后国家通过对外开放利用资本主义建设社会主义
医院作为向患者提供医疗护理服务的机构在公民的日常生活中起着举足轻重的作用,随着门诊就诊患者的增多原有的人工导医管理系统已经无法满足现在的就诊要求。为了减少患者就诊
铜绿颜料在文献中多有记载,但是关于其成分的记载较为混乱,其中碱式氯化铜、碱式碳酸铜、碱式醋酸铜、水氯铜矿等都被称为铜绿。在本文,研究的是以碱式氯化铜为主要成分的铜
<正> 一在西方当代美学史上有一个重要的美学流派,即表现论。它是西方一度兴起的浪漫主义艺术思潮在理论上的总结。这一理论同后来的符号论美学与完形心理学美学又有着密切的
私募股权基金(以下简称PE)发端于19世纪末20世纪初的美国,有限合伙制度在PE领域运用的首例实践为1958于美国成立的第一家有限合伙制风险投资机构——Draper、Gaither&Anderson。
<正>行情分析: 目前,在各大中小城市专卖店、大百货店大行其道的今天,如果别出心裁地开一家杂货铺,进一批价廉物美的各式各样手工制作的货物,不仅能用古色古香的小饰品和手工
期刊
伴随着电子商务的迅速成长,民营快递业在我国也得到了前所未有的发展。截至2011年底,全国持有快递业务经营许可证的法人企业超过7500家,其中跨省(自治区、直辖市)经营快递业务的
目的通过观察补中益气汤对肺腺癌荷瘤裸鼠移植瘤中LRP蛋白表达影响,探讨补中益气汤治疗肺腺癌的作用机制。方法体外培养A549/DDP及A549细胞,接种于BALB/c nu/nu裸鼠腋窝皮下,
<正> 我研究中国近代翻译文学的目的,固然是为了梳理近代翻译文学的发展脉络,另方面也是想透过翻译文学这个参照系,更好地认识中国近代文学。也就是说,在中国文学近代化的进
近年来,在巨大的市场需求带动下,作为我国重要支柱产业的汽车制造业发展迅速。现代化的汽车生产线上的设备品种多、数量多、自动化程度高,涉及的自动化技术包括PLC技术、通讯技