协同过滤推荐算法及其优化研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:liuhaiyi123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术与电子商务的高速兴起,人们的生活质量水平得到了很大的改善,并且周围的网络信息资源也随之呈爆炸式增长。这种由于出现过量的网络数据信息致使人们难以获取有益信息的问题,即“信息过载”现象。搜索引擎技术虽然在一定程度上缓解了上述问题,但却不能向用户提供个性化服务,即用户需要花费更多的时间和精力才能获得令其满意的搜索结果。在这种情形下,个性化推荐系统应运而生,不仅能够有效缓解“信息过载”给用户带来的困扰,而且能够分析总结用户历史行为数据,从而帮助用户找到其可能感兴趣的信息。本文主要针对目前应用最广泛的协同过滤推荐算法在解决系统可扩展性与数据稀疏性的过程中仍存在的一些缺陷进行分析,并提出了相应的优化解决方案。本文的主要工作有:(1)针对目前基于不同聚类技术的协同过滤算法在缓解系统可扩展性时未能同时考虑用户对项目类型的兴趣偏好以及聚类效果欠佳的问题,本文提出了融合用户偏好优化聚类的协同过滤推荐算法(CF-UPOC)。首先,在数据建模时加入项目类型特征,并利用RP-IIP算法形成细粒度用户-项目类型偏好矩阵;然后,在该矩阵上利用蝙蝠优化的用户模糊聚类算法进行聚类,并从隶属度较高的簇中选取最近邻居;最后,利用用户加权相似度对目标用户进行评分预测并产生推荐,进一步提高推荐结果准确性。实验结果表明,CF-UPOC算法在评分预测准确度与实时性方面均有所提高。(2)针对目前基于不同相似性度量的协同过滤算法在缓解数据稀疏性时未能同时考虑共同评定项目稀少、用户兴趣漂移以及项目流行度这三大问题,本文提出了基于用户混合相似度模型的协同过滤推荐算法(CF-HSM)。在构建混合相似度模型时,不仅能够在面临共同评定项目稀少的情况下,利用KL散度充分考虑用户评定过的所有项目之间相关性,而且在Pearson相关系数的基础上考虑到用户的兴趣漂移问题以及项目流行度问题,从而引入时间权重函数和项目流行度惩罚因子对用户评分进行加权处理。最后将混合相似度模型嵌入基于用户的协同过滤算法进行项目推荐。实验结果表明,CF-HSM算法在评分预测准确度、分类预测准确度以及覆盖度方面效果更佳。
其他文献
近年来,随着我国经济的高速发展,人们对地下空间开发与利用的需求越来越高。而我国西南地区地质条件复杂,在深埋高地应力条件下,软岩隧道工程建设工不得不面临围岩大变形灾害的威胁。软岩隧道大变形灾害具有危害程度大、治理费用高、施工风险大的特点,造成支护体系中衬砌开裂、钢拱架扭曲等各种灾害问题。同时传统的强支护体系在软岩隧道大变形处置中受到了极大的挑战,很难取得理想的支护效果。基于此,从软岩隧道围岩形变能合
本文选取1912-1936年间的女性报刊为阅读客体,研究这一历史时期内的女性阅读情况。第一章对研究中“女性报刊”的概念进行了界定,论述了选题意义,所要研究的具体问题,采用的
加快土地流转和规模经营被认为是农业现代化的基础和前提,实现土地适度规模经营、提高农牧民收入水平是解决“三农”问题的关键。在内蒙古,随着草地流转市场的不断发展,以及
海拉尔河位于内蒙古自治区呼伦贝尔市,是额尔古纳河的一级支流,主体为地表水Ⅲ类功能区,在维护地区生态环境良性循环和经济发展中扮演着重要作用。由于流域工业废水、城镇生活污水、畜禽粪便排放以及农业化肥农药的使用,导致海拉尔河流域出现水资源短缺、水质变差等情况。探明海拉尔河水环境因子时空分布特征及来源,有助于海拉尔河水环境污染防控;分析经济发展和河流水环境变化的关系,有助于促进经济和环境的协同发展。论文以
受经济发展过程中城乡差异的影响,农村人口移居城镇的现象愈加普遍。但在中国特殊社会经济制度尤其是土地制度下,这部分农村人口只是实现了从农村向城市的地域转移及职业转变,其与农村土地仍然有着千丝万缕的联系,在较大程度上影响中国新型城镇化进程。本文试图从土地角度分析农村土地对农村转移劳动力市民化的影响,为解决农村转移劳动力市民化自由决策的土地束缚问题,促进新型城镇化发展提供理论依据和现实参考。通过对全国四
目的:脑型疟疾(cerebral malaria,CM)是由恶性疟原虫感染所致,是严重危害人类生命健康的疟疾并发症。大量的文献指出,脑疟的发病机制可能与血小板活化。过度的炎症反应以及微
资产剥离作为企业资本运营方式之一,在资本结构调整、资源配置方面都发挥着越来越重要的作用。资产剥离与并购的不同之处在于前者属于紧缩性的战略重组活动,而后者属于扩张性
玉米(Zea mays L.)作为种植最广泛的粮食作物,具有重要的经济价值,然而玉米受到胁迫后引起的产量和品质下降给农业生产带来巨大损失。当受到病原菌侵害后,玉米会产生植保素来
人脸检测作为计算机视觉领域的一个重要分支,是人脸跟踪、表情识别、人脸识别和年龄估计等诸多人脸相关技术中至关重要的一步。人脸检测结合深度学习技术,将检测的精度推向了
随着我国扶贫工作的不断深入开展,中央及各地方政府陆续出台了一系列的脱贫攻坚制度与政策,取得了显著的减贫成效。我国贫困地区主要分布在西部山区、中部、西南及东北地区。东北地区作为主要贫困区,贫困人口较多、贫困发生率较高且脱贫难度较大,脱贫攻坚工作仍然是重点难点问题,脱贫攻坚任务仍然十分艰巨。本文利用黑龙江省兰西县农户调研数据,从收入及“两不愁和三保障”方面构建测度农户家庭多维贫困的指标体系,分析农地经