基于神经网络集成和用户偏好模型的协同过滤推荐算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:w18asp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和电子商务的蓬勃生长,网络数据信息以指数级别的趋势增长,用户不得不耗费大量的时间去搜索自己想要的信息和商品,人们进入了一个“信息超载”的时代。推荐系统应运而生,它的主要任务是主动从海量的资源中为用户推送其可能需要的资源,缓解信息检索的压力。在目前的应用中,协同过滤算法取得的成就无疑是最大的,但是在发展中同样不可避免的遇到很多障碍,数据稀疏问题就是阻碍其发展的一个重要难题。针对数据稀疏性问题,本文从用户兴趣的角度出发,利用当前的用户数据,构建用户偏好模型预测未评分项目的分值,填充数据到用户评分矩阵中。然而,用户偏好存在描述上的模糊性和不确定性,给用户偏好建模带来了一定的困难,需要引入机器学习方法来构建用户偏好模型。神经网络集成算法具有很好的泛化能力,是目前机器学习领域的一个研究热点,可以用来模拟用户的偏好。但是面对用户偏好的复杂性,神经网络集成算法也会存在这样或那样的不足。针对这样的情况,本文首先对传统的神经网络集成算法提出自己的改进思想,提出了基于差分进化的负相关神经网络集成算法,提高了神经网络集成算法的泛化能力;其次,利用改进的算法,结合现有的用户数据,构建用户偏好模型;最后利用构建好的偏好模型预测未评分项目的分值,填充用户评分矩阵,并针对可能产生的填充过度问题,对相似度的计算也做了一个改进。基于差分进化的负相关神经网络集成算法的基本思想是:在集成个体的生成中,为了增加集成个体的差异性,引入负相关学习方法并行训练成员网络;在结论的生成中,利用差分进化算法的良好的寻优能力,对成员网络的权重系数进行优化。通过实验仿真,并将它与其他算法进行对比,结果表明该算法无论是在泛化性能方面还是在鲁棒性方面都表现得更好。基于差分进化神经网络集成的用户偏好模型的基本思想是:充分利用项目特征属性,构建项目特征向量,通过项目特征向量和用户偏好的映射,构建用户偏好模型,并采用提出的差分进化负相关神经网络集成算法模拟用户的兴趣爱好。通过实验证明,提出的差分进化负相关神经网络集成算法能够很好的模拟用户的喜好,预测对未评分项目的分值。基于用户偏好模型的协同过滤推荐算法的基本思想是:使用构建好的偏好模型预测未评分项目的分值,填充用户评分矩阵,形成了一个伪用户评分矩阵。在利用伪用户评分矩阵计算用户的相似度时,针对可能产生的填充过度问题,只选择部分的项目进行计算。通过MovieLens数据集测试,该算法比传统的协同过滤推荐算法有更好的性能。
其他文献
曾侯乙编钟1978年出土于湖北随州,现藏湖北省博物馆,是我国目前出土数量最多、重量最重、音律最全、气势最宏伟的一套编钟,堪称“编钟之王”,是青铜器冶炼的巅峰之作.rn曾侯
一rn少年坐在浓密的盆景下,闭着一只眼,左手托在右手上,右手做着手枪状,略为斜举着,对着楼下来来往往的车辆和人群做瞄准状,但他嘴里并没有发出相应的嘭嘭声,他的动作就定格
期刊
第一部分:隶书发展史(1)隶书及相关书体的称谓通常所谓的隶书至汉武帝时期为成熟隶书典型,秦代、汉初的隶书普遍带有篆书遗存,近世称之为篆隶或古隶;汉初的草体出于对隶书的
黎子流市长最近在谈到区街工作时说:今年上半年,区的经济形势是好的,各方面工作也取得了成绩,希望大家再接再励。下半年,各区要认真抓好如下几项工作:一、紧紧围绕“质量、
大夏二年墓志出土于1993年,出土地是在内蒙古乌审旗境内的赫连勃勃大夏国墓葬群,也是鄂尔多斯地区发现的唯一一座具有明确纪年的大夏墓志。在众多的北朝书法中是一件非常明显
高校思想政治理论课教学工作是国家战略的重要工作,习近平总书记给予高度关心和支持,为大力发展课程体系的建设和改革,教育部高等学校思想政治理论课教学指导委员会专门制定
《元腾墓志》,或称《元腾暨妻程法珠墓志》。志原题《大魏故城门校尉元腾墓志铭》。刻于北魏神龟二年(公元519年)十一月九日。1925年于河南洛阳城北徐家沟出土,现藏河南博物
《曹望憘造石弥勒像》全称《襄威将军柏仁令齐州魏郡魏县曹望憘造像》,立于北魏正光六年(公元525年)三月二十日。台座四面均有雕刻,每面高27cm,宽63cm。三面刻像。一面刻造像
经过认真的筹备,由中国书法家协会篆书专业委员会主办,大同市恒瑞实业有限公司、云冈写经院承办的“当代篆书名家提名展”将于2012年6月16日在历史文化名城大同市展出.rn中国
马子明,1958年1月出生,大专文化,现任大同市工商行政管理局咨询中心主任。现为大同市书法家协会副主席兼秘书长、山西省书法家协会理事、中国现代青年书画家协会常务理事、山