推荐算法中冷启动问题的研究与实现

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:hqxx03447
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息过载的时代背景下,推荐技术可以帮助用户对信息进行有效筛选,协同过滤算法以其效率高、精度准的特点在推荐系统中得到大范围普及。尽管如此,随着推荐系统中的项目和用户数量的快速增长,该算法正面临着严重的冷启动问题,这大大降低了算法本身的推荐效果。因此,为了使推荐算法在冷启动环境下仍能表现出良好的推荐效果,本文对原有的推荐算法进行了改进,改进分为四个方面:一,为解决数据稀疏性会对聚类结果及推荐效果产生影响这一问题,本文基于项目属性间的相似性对评分矩阵进行了预填充,数据稀疏性得以充分缓解。二,针对协同过滤算法中存在的用户冷启动问题,本文引入了用户的人口统计学信息,将用户间的相似度计算公式修改为评分相似性与人口统计学相似性的动态加权,这样系统能够针对不同用户的不同情况对两者所占比重进行动态的调整。当新用户第一次使用推荐系统时,改进的相似度计算公式能够根据用户的人口统计学相似性为新用户寻找最近邻,并产生推荐。三,针对协同过滤算法中存在的实时性差的问题,本文采用聚类算法对用户进行离线聚类。本文优化了k-mean 算法中初始聚类中心的选取,提高算法的稳定性。然后,使用改进后的聚类算法对用户进行离线聚类,将兴趣爱好相似的用户聚集在同一类别中,当新用户到达推荐系统时,对新用户进行在线的聚类划分。“离线聚类,在线划分”可以有效提高寻找最近邻的效率和推荐系统的实时性。四,针对协同过滤算法推荐种类多样性不高的问题,本文提出了一种新的对流行度较高项目的评分进行分阶段惩罚的方法,以损失最小的推荐精确度换来最大程度上的推荐种类多样性提升。改进后的推荐算法在新用户冷启动环境下可以正常工作,本文使用MovieLens数据集对改进算法进行验证,实验结果表明,该算法可以有效缓解数据稀疏性并解决新用户冷启动问题,同时,相比于其他推荐算法,改进算法在冷启动环境下的推荐精确度有所提高。
其他文献
伴随国民经济高速发展,我国道路交通安全形势日趋严峻。流行病学研究显示,人的行为、尤其是驾驶员行为是道路交通事故的主要原因。本文根据引发驾驶员事故行为各种因素的性质
伴随超导物理和低温工程的发展,超导磁体技术在能源、军事、医疗以及科学实验等诸多领域都得到了广泛的应用。超导材料与结构(如磁体)往往是处于极低温、强电磁场和强载荷等
从公共图书馆特色资源库的立项原则、建库模式、结构设计、技术规范、发布运行等几方面阐述了对地方特色数据库建设的几点意见和看法。
以社会化的涵义入手,结合学生工作现象,讨论青少年社会化不足的涵义、外在表现及其产生的原因。据此,力图从社会工作的理念及其在学校环境中应用的角度出发,探讨社会工作在解决青
目的:制备雷公藤甲素自微乳给药系统,并对其药剂学性质进行评价。方法:通过溶解度试验及伪三元相图的绘制,筛选出雷公藤甲素自微乳的处方工艺;以自微乳平均粒径和自微乳化时
近些年来,全国各地区地震灾害频发,绿地的防灾避险功能在逐渐受到人们的关注和研究,然而我们可以发现的是现阶段的城市建设中由于绿化面积偏少,导致能够提供防灾避险功能的绿
基于大地坐标全微分公式探讨了北京1954坐标系和西安1980坐标系之间的相互转换问题,对常用的3参数法和7参数法做了一些改进,并基于湖北省内的控制成果做了大量的实验分析,进
目的 探讨优生优育检查中TORCH抗体检测的临床意义。方法 选取2017年4月至2018年2月该院收治的不孕女性150例纳入观察组,另选取同期进行优生优育检查的女性150例纳入对照组,
【正】 “教育必须为社会主义建设服务,社会主义建设必须依靠教育”,这两个“必须”是社会主义教育规律和社会主义建设规律的反映,也是发展和改革农村教育,使我国农村教育转
基于地理本体应用模型,从干旱河谷自然本底特点及其形成机制入手,利用本体建模软件protege 4.1构建岷江上游干旱河谷领域本体模型,利用该区域基础地理数据分类提取出DEM、坡