基于遗忘曲线的推荐算法研究

被引量 : 24次 | 上传用户:jianhua230747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网技术的发展,人们进入“信息爆炸”的时代,面对海量信息,用户不知道如何将自己感兴趣信息从这海量的信息中提取出来,搜索引擎已经不能满足人们的需要,推荐系统成为解决这一需要的重要方式。而协同过滤因为其算法简单,又能够处理复杂的问题并产生比较良好的效果而被人们广泛应用,也成为了推荐系统中最成功的技术。然而用户的兴趣是时刻变化的,且对于新用户系统无法预测用户的偏好,原始的推荐技术并没有满足这些需求,而本文就是致力于这方面问题的解决。首先,本文提出了基于艾宾浩斯遗忘曲线的用户推荐算法,由于人的兴趣是不断变化的,而这种变化是自然遗忘的过程,也就符合遗忘曲线,所以用遗忘函数模拟人的兴趣变化。由于时间对评分的起着很重要的作用,在使用相似度算法时加入了时间因子,对用户的原始评分进行衰减,以此来反应用户的兴趣变化。然后为本文提出的算法设计了两组实验来验证算法的有效性。通过两组实验的结果证明,总体上来讲,本文提出的基于遗忘曲线的相似度的计算方法比传统的算法要好一些。那么在推荐系统中,结合自然规律,通过运用艾氏遗忘曲线所表述的遗忘的规律来反应用户兴趣的变化,对用户评分进行衰减,可以明显的提高系统预测的准确度。这也表明,在推荐系统中,人的认知规律可以发挥很重要的作用。其次,基于以上的内容,本文针对推荐系统中冷启动问题又做了详细的研究,分析和比较了前辈们提出的各种解决冷启动问题的算法,明确每个算法的优点和不足;同时介绍了通过交叉推荐引起的思考,由于人生活在社会中,不同的人有不同的社交圈,而目标用户社交圈中的人的偏好在某种程度上可以反映目标用户的偏好,基于这种思想,结合Sahebi提出的算法,将遗忘曲线的思想加入进去,提出了在多维网络中基于用户社区划分来解决冷启动的方案。通过清空数据集中用户的书评来模拟系统中的冷启动问题,在能克服冷启动问题的情况下,用社区群体的兴趣漂移来预测用户对图书的评分。对于本文在实验部分将此方案与传统的协同过滤推荐算法进行了对比。实验证明,在邻居数不断增加的条件下,前者预测的准确度要优于后者,也就是说,该算法能够克服冷启动问题提高推荐质量。
其他文献
本文提出了一种新型组合转镜式多方位扫描条码识别器光学设计原理及其光路,扫描轨迹以及必要的公式。实验样机表明它能对工作距离1m,景深0.4m,工作范围0.40.4m内以每秒1m运动的条码进行多方位
从农业社会到工业社会,再到信息化时代,交通的设施和服务都在不断的进行着更新和变革,并逐步构成了人类文明的重要组成部分。在这个过程中,文化的发展一直伴随其中,并不断的
近日,住建部发布通知,就加强建筑市场监管一体化工作平台工程项目信息入库管理工作提出具体要求。通知明确,将采取以下几方面措施:一是明确平台功能定位,确保工程项目信息及时
以竹芋淀粉的提取率为指标,通过单因素试验和正交试验确定了竹芋淀粉的最佳提取工艺。结果表明:料液比1∶6(g/mL),浸提时间1.5 h,浸提温度35℃,浆料pH8时,竹芋淀粉的提取率最高,约为80
本文回顾分析了近年我国城市更新与改造的几个有代表性的例子,总结其经验与教训,提出了城市进一步更新——从旧城和城市整体出发的理论与实践的粗浅建议。
结合污水系统的现状,对存在的问题进行了分析,论述了建立污水系统在线监测体系的重要性,进一步阐明了采用SCADA系统构建监测体系的可行性,指出该体系对保障污水厂正常运行具
明清云南文学的繁荣自有其内在原因,但科举考试的促进作用不容忽视。在科举考试的驱动下,云南的学校教育发展迅速,文化得到极大普及,从而奠定了明清云南文学繁荣的人才基础。
新时代在全民健身的大环境下,市民对生活质量的要求逐渐提高,活动形式愈发广泛多样。体育舞蹈渐渐进入大众视野,针对济南市体育舞蹈培训机构初步成立、逐渐发展以及趋于成熟
心源性猝死(sudden cardiac death,SCD)是目前心血管疾病的主要死亡原因。而恶性室性心律失常是SCD最常见的诱因。埋藏式心脏复律除颤器(implantable cardioverter—defibrillato
本文采用合阳县2012年水资源公报及水利普查、年报的数据资料作为分析依据。对合阳县社会经济各部门的用水结构、变化趋势、用水水平等用水特征及综合用水水平等做了细致的分