一种基于物品协同过滤的改进长尾推荐算法

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:lijiazhivvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前传统的推荐系统,存在严重的长尾效应。推荐系统往往只会给用户推荐当前比较热门的物品,而具有较高价值性但比较冷门的物品没有得到良好的推荐。因此,为了解决上述问题,本文提出了一种基于物品协同过滤的改进长尾推荐算法。本文的主要工作包括内容如下:(1)目前基于物品的协同过滤推荐算法,其在数据集上存在较为严重的稀疏性,稀疏性影响相似度的计算,越稀疏计算得出的推荐准确率越低,且长尾物品并没有得到较好的挖掘。为了解决稀疏性问题,引入了K-means聚类算法,该算法通过随机选取初始种子,并且不断优化迭代,来达到聚类的效果。本文在传统的K-means聚类算法基础上进行改进,提出了融合项目流行度的K-means聚类算法。该方法引入流行度的概念,计算每个物品的流行度,通过流行度来选取出初始种子,不断进行优化迭代。实验证明,改进后的聚类算法对于长尾物品的挖掘能力有进一步提高,对于长尾物品的搜寻能力更好。(2)通过传统基于物品的协同过滤推荐算法和基于用户的协同过滤推荐相比较,可以发现基于物品的协同过滤推荐算法长尾物品丰富,针对其做用户的个性化需求能够较大地挖掘出长尾物品的价值。本文中引用了长尾因子,该因子不仅考虑到了用户,也考虑到了物品。在计算相似度时,对热门物品降低权重,对冷门物品提高权重,对活跃用户降低权重,对普通用户提高权重。计算覆盖率和流行度两个指标,通过实验结果表明,该方法能够有效地挖掘出冷门物品。(3)获得相似度后,在给用户推荐的时候,采用的是Top-N推荐。传统的Top-N推荐将相似度最高的前N个物品推荐给用户,这种方法对于用户来说可以快速获得与自己兴趣最接近的物品,具有不错的准确率,但是这种方法推荐的覆盖率效果不是很明显。本文在此基础上进行改进,引入了一个频繁比例因子,通过该因子调整推荐列表的平均流行度。通过实验结果表明,该方法能够有效提升推荐的覆盖率以及降低推荐序列的流行度。
其他文献
目标检测是智能安防、自动驾驶、缺陷检测等热门领域的关键技术之一,随着深度学习的发展,基于深度学习的目标检测技术取得了优秀的效果并且已经具备了良好的理论基础。目标检测场景对嵌入式设备有着广泛的需求,并且嵌入式GPU平台由于其出色的计算能力和模型部署的便捷性成为了最常用的图像处理平台之一。但是目前基于深度学习的目标检测算法对嵌入式设备要求较高,并不能完全适用于嵌入式GPU平台。为此,本文对目标检测算法
学位
深度强化学习(Deep Reinforcement learning,DRL)作为机器学习领域的重要学习方法,主要研究智能体如何在未知环境中做出较好的决策,是最有希望实现人工智能这个目标的研究领域之一。目前,深度强化学习在诸多领域如游戏、机器人等取得巨大突破。深度强化学习的目标是找到最优策略,从而取得最大期望回报。为了实现深度强化学习的目标,要求智能体理解所处的环境状态,能够根据任务要求做出符合环
学位
随着智能电网及能源互联网的快速发展,海量异构的电力通信设备不断接入到电力基础设施中,极大地促进了电网的数字化建设。然而,一旦电力通信设备出现故障可能引起电网扰动,威胁电网安全。海量的设备使得故障研判数据呈指数级增长,且由于设备功能各异,故障千差万别、影响不一,导致运维过程中出现监管实效差、故障信息定位难等问题。而现有电力故障数据库结构冗余、关联复杂难以分析,故障信息检索效率低、准确率差,其对电网智
学位
近年来,人脸图像的超分辨率研究具有极其重要的意义,受到越来越多的关注。传统的人脸图像的超分辨率往往采用插值方式容易导致纹理结构粗糙,甚至人脸结构扭曲。基于生成对抗网络的人脸图像超分辨率方法虽然具有强大的数据生成能力,但是由于缺乏反馈不能实现从低分辨率输入到超分辨率结果的复杂映射,且重建结果存在局部模糊或失真等问题。因此,本文提出基于生成对抗网络的人脸图像的超分辨率的改进方法,主要贡献如下:(1)传
学位
复杂场景下的行人重识别是自动驾驶、智能交通、智能安防等领域中应用非常广泛的算法,也是机器视觉应用领域所研究的热门问题。行人重识别的核心问题是在复杂情景中实现跨摄像机对行人的辨认和搜索。目前针对行人重识别任务的方法取得了较好的识别效果,但还是存在以下问题:一方面,行人属性识别作为行人重识别的重要基础,可以提高对行人的辨识度,在行人属性识别实际应用中,经常会遇到训练样本中的属性不平衡情况,影响了算法的
学位
随着机器学习技术的发展,无监督表征学习已经成为目前最重要的研究方向之一。变分自编码模型(variational autoencoder,VAE)因其显式的生成模型建模方式,已经被视为无监督表征学习领域最具研究价值的模型之一。无监督聚类表征学习是表征学习领域一个重要研究分支。传统深度聚类表征学习方法更多关注通过深层神经网络去提取数据的隐层特征来提升聚类精度,较少对聚类任务中数据类别的确定性问题进行分
学位
<正>2022年末,在江苏省连云港市赣榆区赣马镇农村产权服务交易中心,随着仲马自然村50.5亩土地发包项目的应声落锤,赣马镇当年交易了1668个项目,交易额4450.11万元,分别提前完成年度任务的120%、130%。近年来,赣马镇农村产权交易服务中心,充分发挥交易平台功能,坚持“应进必进”,突出规范化,抓关键、抓落实,
期刊
近年来,城市自然灾害发生的频率越来越高,造成了大量的人员伤亡和财产损失,因此需要大力推进城市灾害防御工程建设,其中完善城市灾害应急管理系统就是很重要的一个方面。但是在目前的应急处理中,不但不同的部门有各自的应急管理系统,各自管理,较为分散,而且系统本身大多数采用中心化管理,以上原因导致应急处理过程存在着消息共享不及时,受故障或者攻击影响较大,事后难以追责等问题。区块链技术凭借其去中心化、防篡改以及
学位
图像超分辨率是计算机视觉领域的一个重要分支,在安防、医疗、军事等领域具有重要的研究意义和应用价值。近年来,随着神经网络等技术的不断发展,图像超分辨率在准确率和生成速度等方面都取得了更好的成就。在图像超分辨率的训练过程中,真实的训练数据一般很难获得,基于此,研究者大都使用人工构造的训练数据进行训练。但是,使用人工构造的数据进行训练得到的图像超分辨率模型存在一个问题,那就是对人工构造的低分辨率图像超分
学位
为了提高基于设计牵头的EPC项目设计管理水平,论文通过分析EPC项目培养过程中所涉及的内容,提出EPC项目设计管理要点,并探讨研究了设计与造价、采购、施工、试运行以及设计变更在EPC项目管理中的应用,解决了设计企业在EPC项目设计管理中存在误区和“黑匣子”等问题,从而推动设计企业自身业务的发展,并不断提升企业自身竞争力。
期刊