基于用户评分与类别聚类的个性化推荐方法

来源 :天津商业大学 | 被引量 : 0次 | 上传用户:freebird_china
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展让人们进入了信息过载时代,用户在网络上寻找信息犹如大海捞针一般,而推荐系统则可以主动为用户推荐其感兴趣的信息,作为推荐系统的核心组成部分,推荐算法备受重视。协同过滤算法作为目前应用最广泛的一种推荐算法,受到国内外众多学者研究,提出了很多优化和改进方法,并获得了不错的效果,但是数据稀疏、片面关注用户评分信息、用户兴趣漂移等问题仍然存在并且长期存在。本文提出了一种基于用户评分与类别聚类的个性化推荐方法(URCC-CF),对传统的基于用户的协同过滤算法进行优化。主要研究工作包括:(1)用户的兴趣偏好会随时间推移而发生变化,即存在用户兴趣漂移问题。本文基于艾宾浩斯遗忘曲线来构建时间因子对用户评分进行加权修正,早期的评分赋予较低权,近期评分赋予较高权重。采用SVD算法对用户-项目评分矩阵进行降维填充,一定程度上缓解了稀疏性,提高相似性计算的准确性。(2)传统的用户相似性计算仅考虑用户的评分,然而用户评分不是衡量用户偏好的唯一因素,用户对项目类别的偏好在很大程度上也体现了用户的相似性。本文综合项目类别偏好、项目类别比例和主观评分偏好三个指标构建用户-类别评分矩阵,并根据其结果为用户进行偏好聚类,提高了用户分类的准确性。综合用户-项目评分相似性与用户-类别评分相似性生成综合相似性,提高了预测评分的准确性。(3)协同过滤推荐中常用的聚类算法普遍存在因为聚类中心的随机性而产生的目标函数陷入局部最优解问题。本文采用花朵授粉算法确定聚类中心,优化模糊C均值聚类算法,对用户进行基于项目类别偏好的聚类,有效解决的局部最优解的问题,同时仅在类簇内进行最近邻查找,缩小了查找范围,有效提高了推荐方法的计算效率和可扩展性。通过在公开的MovieLens数据集上进行检验,证明本文推荐方法有较好的推荐性能。首先通过对比研究确定算法涉及到的最优参数,之后将本文算法与其他三种推荐算法进行对比,证明本文算法在准确度和覆盖率上均优于其他算法。后对比分析了本文提出的基于花朵授粉算法优化的模糊C均值聚类与K-means聚类,实验结果表明本文所用聚类算法能够有效提高用户聚类的准确性。
其他文献
在我国,铁路货物运输承担着社会发展物资与战略性物资的运输任务,是我国物流体系的重要组成部分。随着社会经济的快速发展,人们的生活水平逐渐提高,所需要的生产生活物资需求随之增加,致使货物运输需求上升,新的货物运输方式应运而生,货运行业市场竞争也愈演愈烈。在机遇与挑战并存的时代,铁路货运没有延续优势,相反在市场竞争中处于下游地位,客户流失严重。因此铁路企业想要站稳脚跟、向前发展,那么怎样有效挖掘客户,是
专利权质押融资作为中小科技企业一条重要融资渠道,受到广泛关注,也是评估机构面临的重要课题之一。但我国现有评估技术与评估机制不够健全,使得质押融资视角下的专利估值有失公允,很大程度上限制了该融资方式的发展。实务中常常使用收益法来评估专利权质押价值,而质押专利往往是专利组合的形式,专利组合质押融资估值存在的问题主要是没有公认的评价体系,比如在收益分成率的确定方法上缺乏业内规范,不能科学合理的考虑风险因
当前,人们的生活品质正伴随着社会经济和工业化的快速发展而不断提高,但是城市大气污染也日益严重,一方面给环境空气质量监控带来压力,另一方面也对人们的身体健康和生活造成影响。作为空气质量主要污染物之一的PM2.5尤其备受关注,相关政府部门积极开展防治治理,PM2.5预测防控也成为研究热点,相关成果可为制定合理有效的防治措施提供帮助。针对当前PM2.5预测模型所存在的预测精度低,收敛速度慢等问题,本文在
对于兼具知识密集、技术密集的高新技术企业来说,人力资本是企业拥有的一项极具竞争力、创造力及区分度的生产要素。高级管理人才(以下简称高管)作为人力资本的核心要素,在综合调配企业一切资源走自主创新道路,不断提高企业竞争力的过程中发挥着不可替代的作用。尽管国内外学者都对人力资本价值评估做了很多研究,并取得了一定成果,但对于高管人力资本的定价研究还不够完善,也没有可操作性较强的高管人力资本定价模型能与高新
学位
学位
学位
学位
学位
学位