基于矩阵分解和聚类的混合推荐算法研究

来源 :河北地质大学 | 被引量 : 0次 | 上传用户:d517441645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网的普及和应用,网络上的信息量呈现井喷式增长,推荐系统成为解决信息过载问题的一种重要方式。推荐算法是推荐系统的核心,决定着最终的推荐效果。基于矩阵分解的推荐算法和基于内存的协同过滤推荐算法作为经典的推荐算法被广泛应用于各种推荐系统。但是基于矩阵分解的推荐算法存在着数据来源单一及数据稀疏性等问题,基于内存的协同过滤推荐算法存在实时性不强、评分预测准确性偏低以及相似度计算模型完全依赖共同评分用户等问题,影响推荐效果。为了解决以上问题,本文做出了以下研究:(1)提出一种基于SVD++和用户聚类的协同过滤算法。首先引入用户属性信息增加数据来源,并使用K-Means对向量化表示的用户属性进行用户聚类减少用户相似度计算次数,解决了基于矩阵分解模型的SVD++算法数据源单一问题;然后在用户相似度计算模型中加入时间权重因子获取目标用户随时间变化的相似近邻用户,提高了整个算法的实时性;最后将相似近邻应用到偏差调整项,使用偏差调整项为SVD++模型产生的初次预测评分进行二次预测,得到最终预测结果。经过实验对比,本文提出的基于SVD++和用户聚类的协同过滤算法的预测误差低于SVD++模型和基于用户的协同过滤算法,具有较高的评分预测准确性。(2)提出一种基于SVD和项目聚类的协同过滤算法。首先使用SVD矩阵分解模型将用户项目评分矩阵进行降维处理,提取项目特征向量,并使用K-Means聚类将项目特征向量进行聚类划分,有效解决了数据稀疏性问题;然后提出一种改进的基于KL散度的项目相似度计算方法,该方法根据项目评分的概率分布计算项目间相似性,同时加入热门项目惩罚因子,避免了出现热门项目频繁被推荐的情况,解决了项目相似度计算方法过分依赖共同评价用户的问题;最后结合Pearson相似度和改进的基于KL散度相似度的项目相似度计算方法获取近邻项目,并产生推荐,兼顾了项目评分概率分布和共同评价用户的影响。经过实验对比,本文提出的基于SVD和项目聚类的协同过滤算法一定程度上解决了数据稀疏性问题,具有较高的推荐准确性和有效性。
其他文献
超贫磁铁矿作为河北省特色矿产资源,近年来是河北省铁矿资源的主要来源之一。但由于历史原因部分区域属于无序群采,造成山体开裂、崩塌、滑坡等相关安全隐患问题,生态经济效益减值较大。为落实新发展理念要求,恢复矿山环境,实现“绿水青山”,成为河北省环境恢复治理的重要任务之一。地处于张家口市尚义县庄科村超贫磁铁矿山,是早期的露天采矿活动形成的矿山工程,因早年的无序群采,严重破坏了原有的地貌和植被环境,尚义县随
学位
改革开放以来建筑工程行业高速发展,随着施工企业的不断增加,建筑市场的竞争日益激烈,建筑行业面临来自国内外巨大的竞争压力。EPC模式因其投标与施工周期短、合同关系简单、成本相对较低、权责关系清晰等优势,被广泛应用工程建设领域中。随着分包商企业的不断增加,分包商的综合能力也略有差异,对总包商来说,优选分包商,建立长期稳定的总分包合作关系是提高项目整体经济效益的重要环节之一,因此选出理想分包商对建筑业E
学位
成都天府七小遵循孩子成长规律、教育规律、办学规律,基于整合育人的教育理念,以深化课程改革为抓手,构建了以"全科整合课程体系"为核心的学校教育实践体系,让学校教育过程为"学生大发展"(全面发展+核心素养发展)奠基,从而实现学校的高品位、高质量发展。
期刊
我国中小学校园数量庞大,学生人数众多,学校设施、环境状况对在校师生的身心健康及周边环境具有长效的影响。在全民普及九年制义务教育和双减政策驱动的国情下,中小学校园建设面临新变革,怎样的校园才能顺应时代发展的需求?——这是建筑界与教育界一直在积极探索的问题。因此,本文在前人研究的基础上针对中小学校基于绿色理念的建设方案评价与优化做进一步研究。本论文以四川省凉山地区中小学为研究对象,通过对凉山地区中小学
学位
随着社会经济的高速增长,对各个行业的发展提出了愈来愈高的要求。电力行业支撑着整个社会的进步与发展,因此电力的稳定性和安全性是发展的重中之重。目前检测高压电力设备运行状态的方法中比较流行的是利用法珀腔传感器接收超声波信号进行检测,法珀腔传感器具有悠久的发展历史、制作技术完善,在各种复杂极端的环境中都常常能见到。根据光纤法珀腔传感器解调原理的不同,被分为强度解调和相位解调。强度解调的实验装置以及算法相
学位
当下,我国大部分国有企业基本完成公司化改制,然而在管理模式上并未建立起与现代公司法人治理结构相匹配的股权管理机制。股权管理体系的缺乏和不完善情况的存在会对国有企业改制后的正常运行产生制约影响,因此,如何构建国有企业集团的股权管理体系,使其实现科学化和合理化,以促进国有企业可持续发展是目前市场经济环境中国企面临的重要问题。基于此,文章对国有企业集团股权管理体系的内容展开详细论述,旨在实现国有企业集团
期刊
肝脏作为人体不可或缺的器官之一,承担着人体代谢各种物质的功能,同时又是重要的热能供应器官。随着今天的社会生活节奏变快以及人们不正常的生活作息,导致肝癌患者数量不断增加。CT是根据不同的器官或组织对X线的吸收系数不同来成像的。相对于其它技术,CT成像技术比较成熟,灵敏度较高,能够比较准确的呈现身体的器官、组织和病变位置的详细特征,使医生能够更加清晰的观察,及时制定出有效的治疗方案,因此常用于肝脏肿瘤
学位
肺部医学图像是肺癌诊断和治疗的重要辅助工具,肺癌早期在医学图像上的主要表现是肺结节,因此对肺结节的筛查与分割是肺癌诊断的有效途径。不计其数的肺部医学图像加大了放射科医生的工作量,人工智能技术的发展为辅助人工诊断提供了新的方向并在肺结节的诊断与治疗方面取得了重要进展。为进一步应用人工智能技术提高肺结节诊断的效率与准确度,提出了一种基于U-Net的肺结节图像分割算法。主要工作如下:第一,针对肺结节图像
学位
近年来,在高层民用建筑中因电瓶车充电引起的火灾事故频发,严重威胁到居民的生命财产安全。为了避免电瓶车违规进入高层建筑,在电梯内安装监控,识别电梯内的电瓶车,是防止其入内的可行方法之一。针对电梯内电瓶车识别的问题,提出了一种基于脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)的电梯内电瓶车识别模型。以该模型为基础,进行了如下三方面的研究内容:(1)研究PCNN的
学位
南宫市行政区划属于河北省邢台市,地处河北平原,近年来,在快速发展的条件下,形成了许多的地质问题。河北省实施的引黄入冀工程,极大缓解了当地的缺水问题,但由于外调水存在时限性,需要建设地下水库解决此问题。而建设地下水库最重要的参数为人工补给效果。本次研究从建设地下水库中的人工补给方案入手,对试验前补给方法的选择、引用水源条件、工期安排、工程布设、人员管理、应急预案等方面进行研究;对试验中的入渗能力和水
学位