基于矩阵填充的协同过滤推荐算法研究

来源 :西安财经大学 | 被引量 : 0次 | 上传用户:zhiyuanszy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展带来了一个全新的时代—大数据时代,人们随时随地都在产生和使用大量的数据。海量的数据资源给人们的生活带来了极大便利,但人们想要很快地找到自己需要的信息变得十分困难,这就是“信息过载”问题。在推荐系统中,协同过滤技术是解决信息过载问题十分有效的方法之一。因此,本文以协同过滤推荐算法为研究对象,对其在实际应用中存在的问题进行了研究分析,基于矩阵填充算法提出了新的改进算法。首先,针对原始数据的缺失率较高对推荐效果造成影响的问题,提出基于矩阵填充的协同过滤算法。考虑到用户—项目评分矩阵的稀疏性和低秩性,通过矩阵填充技术中的OptSpace算法对评分矩阵进行填充,然后根据填充后得到的新的评分矩阵,再用协同过滤算法进行推荐。其次,传统的协同过滤算法和基于矩阵填充的协同过滤算法根据相似度寻找最近邻居用户的搜索范围都是整个数据空间,计算量太大,耗费时间,算法的推荐效率不高。此外,k-means聚类方法对数据对象的划分是硬划分,不符合推荐系统的实际情况,聚类效果不稳定。本文提出了基于模糊聚类和矩阵填充的协同过滤算法,在对填充后的评分矩阵进行协同过滤推荐之前根据用户的信息先对用户进行聚类。该算法将最近邻居用户的搜索范围缩小到某个聚类,减少了相似度计算的计算量,提高了算法运行的效率。最后,为了验证所提算法的有效性,在MovieLens数据集上分次实验进行算法有效性验证。通过实验确定算法的相关参数,找到最优的聚类个数以及最近邻居的个数。然后,将基于模糊聚类和矩阵填充的协同过滤算法中的模糊聚类换成k-means聚类,然后对比两种算法的精确度,实验表明模糊聚类对数据对象的划分更加符合实际情况,聚类效果更好。再对几种协同过滤推荐按算法的运行时间进行了对比。数值实验结果表明:基于聚类方法的算法提高了运行的效率;在确定相关参数的情况下,对四种不同的协同过滤推荐算法进行对比试验,本文所提推荐算法在推荐效果方面优于其他对比算法。
其他文献
活动时间分配是指动物在自身生理需求以及外界环境变化等因素驱动下,通过优化各种活动类型所占时间而演化出的适应环境的一种行为策略。活动时间分配是动物行为生态学的基础研究内容,是认识动物对栖息环境适应性的前提,亦是了解动物对外部环境变化响应的关键。猕猴华北亚种(Macaca mulatta tcheliensis)因现今仅分布于山西与河南交界的太行山南端而被称为太行山猕猴,被列入国家重点保护野生动物名录
学位
全要素生产率是经济增长的源泉,也是评判经济增长质量的标准之一。十九大提出了绿色、创新、协调、开放、共享的五大理念,再次强调绿色是我国“一带一路”建设的主流色,要追求全要素生产,实现绿色加速度,促进经济高质量发展,落脚点是提高绿色全要素生产率。我国“一带一路”沿线省区处在国家对外开放的前沿地位,因此“一带一路”沿线省区绿色全要素生产率时空分布特征及其时空影响因素的研究具有重要的意义。本文运用Malm
学位
氯唑西林(Cloxacillin,CLOX)作为一种半合成的β内酰胺类抗生素,主要用于治疗心内膜炎、败血症等由产青霉素酶的细菌导致的疾病,被广泛应用于畜禽养殖业。但不合理使用CLOX会导致动物源性食品中CLOX残留超标,长期食用,会危害人类健康。为了保障食品安全和人类健康,我国相关部门规定,食品动物的肌肉、脂肪、肝以及肾中CLOX最大残留限量(Maximum residue limit,MRL)为
学位
科技改变生活,近些年来,刷脸支付、人工智能、大数据计算等新事物已经频繁出现在我们的生活中,改变了我们的生产和生活方式,依赖于新技术的快速发展而产生的新的经济形态,我们称之为新经济,新经济已然成为我们生产和生活中重要的一部分,为我国新旧动能转换提供了强大的动力支持。本文基于新经济测度的相关理论研究,对陕西省新经济现状进行分析,构建了测度新经济发展水平的指标体系,首先运用核主成分分析法对2018年全国
学位
高脂饮食(High fat diet,HFD)是最为常见的致肥胖及其并发症的因素。随着生活水平的提高,人们接触到高能量、高脂肪食物的机会越来越多,超重和肥胖及其并发症在全年龄层和多地区流行。所以,建立动物模型研究肥胖及其并发症的发病机制就变得尤为重要。关于高脂食物对人类和动物的体型、生理及心理的影响已经有较多报道,但目前高脂饮食对动物空间认知、代谢影响的研究仍不充分。本研究以成年昆明小鼠(Mus
学位
随着我国经济发展由高速增长阶段转向高质量发展阶段,传统经济对经济持续增长的影响减缓。而数字经济利用信息通信技术向传统产业渗透,大力推动生产力增长并促进产业结构优化升级,推动经济高质量发展,因此我国开始大力发展数字经济。根据信通院公布的数据显示,2018年数字经济发展对GDP增长的贡献率为67.9%,数字经济已逐渐成为驱动中国经济发展的新引擎。为了对数字经济发展质量进行测度研究,以便促进数字经济高质
学位
在经济全球化和一体化背景下,世界旅游业进入快速发展阶段,旅游发展已成为国内外共同关注的焦点。它不仅带来了旅游经济的飞速增长,更是促进了区域经济的增长集聚,因此研究旅游业的发展特点具有重大意义。而当前我国已经逐渐步入经济“新常态”发展阶段,旅游产业的发展也由原本的只关注增长速度转变为注重发展质量及效率。提高全要素生产率是当前新常态背景下促进旅游业可持续发展的核心动力,也是有效保障旅游业发展质量提升的
学位
鼠曲草族(Gnaphalieae Cass.ex Lecoq&Juill.)隶属于菊科(Asteraceae Bercht.&J.Presl),紫菀亚科(Asteroideae Lindl.),约178属2100种,世界广布,多样性中心在南非,澳大利亚,新西兰和南美洲。Flora of China记载我国有12属121种,其中63种为中国特有种。截至目前,对于鼠曲草族的系统学研究主要针对南半球的物
学位
研究新的建模方法和时空分析方法,对于理解社会现象和环境动态过程具有重要的理论意义和现实意义。混合时空地理加权回归模型相较于传统的线性回归模型,它不仅仅将时间、空间因素同时纳入到模型中,还将自变量分为全局平稳特征以及局部非平稳特征,其能够有效的解决空间数据的时空非平稳性以及空间异质性。论文将空间滞后回归应用在混合时空地理加权回归模型中,建立能够反映空间相关性的混合时空地理加权空间滞后回归模型,对该模
学位
气候变化、能源替代和经济增长之间存在着十分复杂的关系,三者之间相互依存相互影响又相辅相成。三者之间的不均衡发展势必会破坏气候与能源以及经济系统,而均衡发展有助于气候的改善和能源的充分利用以及提高经济的发展水平。因此,研究三者之间的相互关系,寻求新的均衡条件具有很大的现实意义。本文借助文本挖掘技术对气候变化、能源替代和经济增长进行前期可视化探索性研究,寻找三者之间的相互关系以及该领域的研究前沿和研究
学位