面向稀疏性数据的协同过滤推荐算法的研究与实现

被引量 : 7次 | 上传用户:ewtfgtwegv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于协同过滤的推荐系统是解决信息过载问题的一种很好的方案,而且能够提供一对一的个性化服务。但是基于协同过滤的推荐算法同样也而临着一系列的瓶颈问题,其中对于协同过滤算法的性能影响最大的因素之一是数据稀疏性问题。推荐系统中存在大量的项目,而每个用户只对其中很少一部分项目进行了评分,从而导致评分数据的稀疏,而由于评分数据的稀疏给最近邻居的准确选取增加了难度,从而导致推荐的不准确。本文针对现有推荐系统中的数据稀疏性问题进行深入研究,主要工作如下:1、从相似度计算的角度出发,分析传统相似性度量方法存在的弊端,根据主体(用户或者项目)问的共同评分项数确立目标主体与其他主体之间的邻居等级,并在邻居等级的基础上改进相似度计算方法,使相似性的度量能够更加的准确,继而提出基于改进余弦相似性的协同过滤算法。实验结果表面,该算法能够有效提高推荐的准确度。2、从缓解稀疏评分矩阵的角度出发,分析数据稀疏性产生的原因,并提出了基于项目与众数法空缺评分填补的协同过滤推荐算法,该算法在进行目标用户最近邻居选取之前,先对原始的数据集进行空缺评分填补的预处理,以降低数据集的稀疏性。空缺评分填补以原始数据集作为基础,先使用改进的余弦相似性度量方法计算项目之间的相似度,再根据项目的相似度对原始数据集进行众数法评分填补,缓解评分数据的稀疏性。在填补后的评分矩阵上同样采用改进的余弦相似性度量方法来计算用户之间的相似度,提高用户相似度的准确性,最后,以此相似度选取用户的最近邻居。实验结果表明,该算法可以在一定程度上有效的改善因数据稀疏性而带来的最近邻搜寻不准确的问题,提高推荐系统的准确度。3、分析推荐系统冷启动问题所产生的原因,提出基于评分众数的协同过滤推荐系统中冷启动问题解决方法,该方法采用不同的评分众数选取方法来解决新用户和新项目问题。实验结果表明,该方法能在一定程度上解决冷启动问题。
其他文献
为了生产出一种有益于身体健康的枸杞酸奶,试验在经过巴氏杀菌后的牛奶中添加枸杞汁(2%、4%、6%、8%)、木糖醇和工作发酵剂,经43℃发酵6 h,然后贮藏16 d完成,测定酸奶的理化
支气管疾病一直是威胁人类健康的重要疾病,弥漫性泛细支气管炎是是一种新型支气管疾病,由于目前对该疾病研究较少,治疗手段不足,使得治愈效果不好。笔者结合多年临床经验及近
鄂深8井于江汉盆地西南缘谢凤桥构造中发现了白垩系油气藏,油源对比表明,白垩系原油与沙市、荆西、花园油田新沟嘴组原油同源,源岩是沙市组上段-新沟嘴组下段生油岩,成藏条件
检查孔是判断帷幕断面上是否存在尚未充填的透水裂隙、溶洞,掌握帷幕注浆效果的一种最直接的手段。但检查孔的取芯与分段压水试验无法清楚掌握帷幕断面上尚未充填裂隙、溶洞
创新创业教育,是大学生素质教育的出发点与落脚点,是高校教育教学改革的切入点,是建设创新型国家和实现中华民族伟大复兴的需要。如何结合教育管理学规律,以项目带动式推进创
现行规定的鄱阳湖单退圩堤的启用水位为:万亩以下圩堤为鄱阳湖湖口水位20.5m,万亩以上圩堤为鄱阳湖湖口水位21.68m。据有关部门实地调查,当地市、县水利部门普遍认为现行启用水位
本研究以欧亚种‘亚历山大’葡萄和欧美杂交种‘先锋’葡萄为试验材料,采用有机基质(泥炭:蛭石:堆肥=4:1:1)和混合基质(土壤:有机基质=1:1)为栽培基质,以土壤栽培为对照。研究了基
目前,我国电信业的发展面临着来自国内外、传统互联网行业及硬件设备商的竞争,且自身经营中也是资源投入巨大,电信业为了在竞争中争得一席之地,提升资源利用率,寻求提升电信
云计算作为一种新型的分布式计算模型、商业计算模型,得到了学术、政府等各界的广泛关注。但是云计算利用分布式,共享资源、虚拟化等技术实现系统高可用性、经济性的同时,也
本文主要通过对武汉市社会管理政策的分析,为政府在社会管理方面提供更多有效的,可行的建议和对策,从而不断完善社会管理机制,保证社会的公平与和谐。当前我国经济发展迅速,离建设