基于多目标优化的个性化推荐算法研究

来源 :西安电子科技大学 | 被引量 : 5次 | 上传用户:o9876521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和信息技术的飞速发展,网络产品和互联网用户数量也在快速增长,这将人们从之前的信息匮乏时期带入了现在的“信息过载”和“信息爆炸”的时代。与此同时,各种社会化媒体也在人们的日常生活中得到了广泛应用,并产生大量数据。面对这些海量的数据与信息,用户如何快速的找到自己需要的信息或者物品就成为了一个迫切的问题。因此,推荐系统就成为了各种电子商务、零售企业和网络销售等互联网服务用来减轻用户筛选信息负担的重要技术。通常,推荐系统通过收集和分析用户一段时间内的历史行为,对用户的兴趣爱好建模,从而预测出用户对于其他物品的偏好程度,继而进行个性化的推荐。但推荐算法领域中依然存在一些瓶颈问题需要解决。本文基于多目标进化优化的思想,针对推荐算法过程中各类因素的影响,以及推荐结果不同指标之间的权衡问题进行了探索和研究。主要研究工作和创新点如下:(1)在传统的推荐算法中,更多的是考虑提高推荐结果的准确度,但仅仅考虑准确度可能不足以向用户推荐出满意的物品。推荐系统其他的性能指标,比如多样性,在产生推荐结果时也应该考虑到。所以从用户体验感角度出发,好的推荐系统要同时兼顾准确率和多样性。对此本文提出了一种易于实现的基于多目标免疫优化的推荐算法框架,它能在不降低准确度的前提下,为用户生成具有良好多样性和新颖度的推荐列表。这个方法的核心思想是将协同过滤技术与多目标进化算法相结合,构建一个基于先级联后并行式的混合框架。不同于现有的推荐算法,这种新框架将推荐系统的任务看成是一个多目标优化问题,目的是解决推荐结果中准确度与多样性之间权衡的困境。首先,利用协同过滤算法为后续步骤生成候选解。然后使用非支配邻域免疫算法,同时最大化匹配函数和多样性函数,在候选数据集中进行全局搜索。算法针对当前活跃用户生成一组Pareto解集分别代表一组推荐列表。实验结果表明,这种算法在解决推荐结果准确度-多样性的困境是有效的,它可以向用户推荐比传统方法更加多样化和新颖的物品。(2)借鉴上一工作的优化思想,针对个性化电影推荐,提出了一种基于并行式混合设计思想的推荐模型。在该模型中,电影推荐问题被构建为一个多目标优化问题,用来解决电影推荐中准确度和新颖性矛盾的问题。鉴于在离线训练时无法得知推荐结果实际的准确度,所以在训练阶段采用二部图概率传播的算法计算出用户未评价电影的预测评分,作为准确度的评估构建成第一个目标函数,以推荐结果新颖性作为第二个目标函数。算法将多个用户的推荐结果编码在一个个体中,运行一次可以得到所有用户的多组推荐列表。设计了符合要求的交叉变异算子,使得进化有效的进行。为了降低算法的时间复杂度,首先将用户根据相似度进行聚类,使得对电影评分相似的用户在同一聚类簇内,然后在每个聚类簇中运行算法。本章算法的目的是为用户推荐自己以前并不熟知的新颖的电影,而又不能完全偏离用户以往的观影偏好。最后通过在MovieLens电影数据集上大量实验,验证了本章算法能够有效的平衡推荐结果的准确率和新颖性之间的矛盾关系,为用户产生感兴趣但非流行的电影推荐列表。(3)针对上一工作中Pareto前沿面收敛速度偏慢,算法迭代次数多的缺点,设计了一个更适合实数编码环境下解决多目标个性化电影推荐的概率交叉遗传算子。它通过多父代概率遗传,将系统多次推荐的电影编码更大概率的遗传给子代个体。新的交叉遗传算子更符合用户使用推荐系统时的用户选择特性。实验结果表明,这种算法不仅能够为用户提供满意的推荐列表,而且与上一章算法相比,迭代次数减少,收敛速度加快。(4)社会化媒体可以融合线上数据和线下人们的活动,使得互联网更真实化,从而得到了广泛应用。在基于位置的社交网络中,位置推荐问题不仅要考虑用户的线上行为(比如签到行为、点击行为、点评行为等)和用户在社交网络中的好友影响力,还要考虑线下用户行为受地理位置因素的影响。对此,本文为个性化位置推荐系统提出了一种新策略去探索在基于位置的社交网络中用户潜在的感兴趣的地点,用来克服传统并行加权式位置推荐算法中需要大量实验确定加权系数的缺点。在本文框架中个性化的位置推荐需要考虑的不同因素被构建成不同的目标函数,用多目标进化方法同时优化用户线上签到行为所构成的匹配函数和线下用户在访问地点是受地理因素影响的核密度函数,从而避免了大量调整权重系数的过程。本文还利用了用户线上的社交信息,缩小了当前用户的搜索空间,提高了算法的及时性。为了证明本框架的有效性,本章使用网站Gowalla和Brightkite的部分真实数据集进行了实验。实验结果表明,该算法可以为每个用户提供个性化的位置推荐,具有良好的应用前景。
其他文献
目的 总结阿替普酶在急性脑卒中急诊溶栓中的救治体会。方法 选取36例急性脑卒中患者行阿替普酶急诊溶栓治疗作为观察组,另选取36例急性脑卒中患者给予常规治疗作为对照组,比
"计算机音乐"专业作为一门新兴学科方向,已经在各专业音乐院校普及开来。为了切实培养出一批能够迎合市场的艺术与科技复合型应用人才,我们有必要重视此学科的发展。"Protools数
飞机草是世界上危害严重的100种有害外来入侵物种之一,是我国公布的第一批入侵植物之一,也是广东主要的入侵植物之一.本文介绍了飞机草对入侵地农田、牧草、生态等会造成严重
渠道工程管理的养护,直接影响到渠系工程的使用寿命及灌区的生产效益。文章从渠道的防渗、渠道滑坡防治、渠道的防冲、渠道防淤、渠道的冻胀、渠道的防洪及渠道的防决等方面,
本文基于混凝土泵车的实际情况,按柔性支承体系的假定进行了支腿反力和抬腿量分析,并给出了相应的计算方法。
高光谱影像特征的利用率对提高其分类精度具有重要意义。为充分利用影像的特征,提出了一种特征重标定网络的高光谱影像分类方法。该方法通过全局平均池化将特征图转换为具有
背阔肌肌腱移位术是治疗后上型不可修复性巨大肩袖撕裂的重要方法,它通过重建肩关节力偶、恢复外展旋转肌肌力,缓解疼痛和改善肩关节功能.其适用于年轻、活动量大且无明显骨
<正>道路桥梁的建设从立项、勘察、设计、施工到最后的验收交付用时相对漫长,在其过程中的产生众多勘测数据称之为测绘档案。对这些档案的维护十分重要,一个数据偏差就可能造
早在学界提出以“开拓性地研究传统文学史所疏漏和遮蔽的大量文学现象,对传统文学史在过于政治化的学术框架下形成的既定结论重新评价”为初衷的“重写文学史”的口号之前,姚雪
以某型号混凝土泵车为例,将混凝土泵车支腿、臂架及车架结构进行等效简化,通过有限元参数化仿真分析其支撑系统的各支腿反力,并利用解析法进行结果验算。为混凝土泵车、起重