基于协同过滤的推荐算法及系统实现

来源 :安庆师范大学 | 被引量 : 6次 | 上传用户:hualidewushi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在21世纪,随着网络的普及,推荐系统得到了较大的发展。在互联网普及之前,人们想要得到问题解决方案,则需要购买相关的书籍或者请教相关专业人士。而在互联网出现之后,网络上的信息越来越多,答案也会随之增多,人们无法及时获取到正确的、符合自己需求的答案,需要在答案中人为的筛选。而内容或信息提供者想要更好的服务于用户,增加用户的粘性,希望用户能够在其系统中快速得到自己的需求信息,所以推荐系统随之产生,其作用逐渐显现,使得众多的组织和学者对推荐系统做了更多的研究和改进。当今推荐系统已经扩展到很多领域,如新闻、音乐、影视、商品等都需要针对用户进行个性化推荐。协同过滤推荐算法凭借着其优秀性能迅速发展。协同过滤推荐只关注了用户或项目之间的关系,而不需要关注用户或项目本身的内容,所以其适应性强,能够产生新异推荐和个性化推荐。但因其广泛的应用,随之而来的暴露出其系统的缺陷性,比如系统稀疏性,可扩展性低等,当用户和项目急剧增多时,用户项目矩阵会极度稀疏,使得计算准确性下降,且系统的计算时间会随之增长,导致系统不能实时推荐,影响其推荐效率。本文主要针对系统的相似度计算方法和数据稀疏性进行改进,研究工作主要包括:(1)由于项目的评级是由用户评估的,因此用户具有主观情绪,会导致不同用户整体的评分趋于两极化,使得他们的整体评分趋于高或低,产生由于主观情绪而造成的评定标准不同问题。由于数据的极度稀疏,发现用户对电影的评价数量不同,少数用户因和目标用户拥有较少的共同评分而计算不准确,因此,本文提出评分标准惩罚机制和低共同评分项惩罚机制,使用用户评分差对评分标准进行约束,使用Tanimoto系数计算用户共同评分项占比,综合上述两种修正方案,经多次实验及数据拟合,构造出新的相似度计算公式,得到了较好的推荐效果。(2)由于数据量的增大,原始矩阵稀疏等级逐渐提高,较大程度上影响了推荐系统的性能,使得推荐结果不准确。为了更好的解决数据稀疏性问题,本文根据信息熵论理论,使用信息熵的思想提出项目置信度。因不同项目的评价次数不同,而高评价次数项目更能代表用户兴趣,项目置信度可较好衡量用户兴趣度。将传统余弦相似度与项目置信度相结合,对初始矩阵预填充,进而解决原始矩阵稀疏问题。针对上述提出的评分标准不同问题,此次利用欧氏距离公式去衡量用户间关系,与传统的算法相结合做出推荐。在与传统算法对比实验中表明,本算法优于其他对比算法。(3)经过上述对协同过滤推荐算法研究,本文构建了简单的电影推荐系统,将所研究的算法用系统的方式呈现。最后,提出进一步研究方向和思路,更深层次的解决推荐算法所存在的问题。
其他文献
目的研究维吾尔族和汉族健康受试者单剂量口服氯沙坦钾片(抗高血压药)的药代动力学特征。方法 20名健康受试者(其中维吾尔族10名,汉族10名,男女各半),单剂量口服氯沙坦钾片50
研究了以亚氨基二乙腈为原料制备草甘膦中间体双甘膦的工艺条件,主要探讨了碱解过程中水解温度及氢氧化钠用量对亚氨基二乙腈水解收率的影响,并进一步考察了几个厂家生产的亚
利用Idso作物缺水指标(CWSI)定量诊断作物的水分状况,关键在于确定充分 供水条件下的作物缺水指标下基线。由于其受生育期内作物形态改变的影响,采用不同的下 基线势必对CWSI结果
随着信息技术的发展,数据库外包服务正日益普及。在外包数据库模式下,个人或组织将自己的数据库业务外包给数据库服务提供商。外包服务商为数据所有者和数据库用户提供远程的数据库服务,避免个人或组织在数据库管理方面重复的人力和物力投入,并提供更好的可维护性和可扩展性。但是,由于第三方提供的数据库服务并不完全可信,外包数据库模式面临隐私泄露、数据盗窃、恶意篡改等一系列安全问题。密码技术将原始数据转换为无法辨识
<正>1立项背景烧伤、创伤是平时和战时极常见的一种损伤,是导致青壮年死亡的首位原因,其发病率和疾病负担位居各类疾病之首。在上海等发达地区,生活意外、工业事故、恐怖袭击
介绍了榆林市枣树病虫害防治存在的问题,分析其制约因素,并提出防治对策,以为榆林市枣农提供参考。
介绍了磷系、硅系和金属化合物阻燃剂的阻燃原理,综述了它们在高分子聚合物中的应用并对它们的发展方向进行了展望。
委婉语在人们的日常生活中被广泛而鲜活地使用,成为词汇中不可或缺的组成部分,一直引起人们的关注。所谓委婉语就是“用好听的、使人感到愉快的说法代替令人不悦的或不敬的表
随着世界石油工业的不断发展,大斜度井、分支井和水平井等钻井技术越来越多地被用来开发规模更小、油层更薄、物性更差、非均质性更强的油藏。地质导向技术由于其自身的特点,
公路线形灵活性设计是依据现有的法规、标准、规范,在不降低安全性的前提下,通过合理选择标准和灵活运用设计指标,寻求达到更符合公路沿线可持续发展的需要和利益的一种设计