基于项目聚类与SVD奇异值分解的混合推荐算法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:fjutjwzx4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的兴起,互联网时代早已到来,无论是在办公场所还是在家里,无论是在户外还是在户内,手机都是每个人寸步不离的便捷工具,手机早已成为现代人生活中必不可少的工具。目前市面上手机软件千千万,使用软件的用户想要从中获取到自己感兴趣的内容,早已不完全依赖于用户自己的力量。如果一个软件想要获得长足发展,那么就必须要在内容上寻求差异化,向用户精准提供他们感兴趣的、新鲜的内容,让用户使用软件的体验感更好,黏性更高。而推荐系统正是各个软件获取用户的抓手,利用推荐系统不仅可以向用户提供个性化推荐,还能精准推荐用户感兴趣的内容,如此软件便能有更好的发展以及更高的市场占有率。传统的协同过滤推荐算法存在3个问题:一是评分矩阵维度较大,这就使得计算量较大;二是矩阵较为稀疏,大量的未评分项目会影响相似度的计算结果,从而导致推荐效果不好;三是数据的动态性,用户的喜好会发生变化,用户以及项目的类别也会发生变化,这对算法的响应时间以及准确度都是考验。本文的基于项目聚类的推荐算法可以解决传统协同过滤算法的问题,而SVD奇异值分解可以丰富推荐的种类,增加算法的多样性。本文对数据集进行描述性统计,初步了解数据集,继而对数据进行预处理,得到用户-项目评分矩阵。利用基于项目聚类的协同过滤算法、基于SVD奇异值分解的推荐算法,对数据集进行实证分析,分别得到推荐列表以及评价标准的数据值,便于与混合推荐系统的效果进行比较。利用基于项目聚类的协同过滤算法对数据进行分析,根据目标用户评分过的项目寻找近邻项目,并得到各个近邻项目的预测评分;利用SVD奇异值分解法,得到目标用户未评分部分的预测评分,将两个算法得到的预测评分混合后进行排序,得到混合推荐算法的推荐列表。根据评价标准的数据值,将混合推荐算法与三个独立的算法的效果进行比较,同时结合推荐列表是否具有多样性,得到混合推荐算法效果最优的结论。本文基于传统协同过滤算法的三个问题提出了基于项目聚类与SVD奇异值分解的混合推荐算法,首先根据用户评分对所有项目离线进行聚类,生成对应的聚类中心,然后根据目标项目与聚类中心的相似性,只需要扫描与目标项目相似性最高的前若干个聚类就可以找到目标项目的大部分最近邻居,从而有效提高推荐系统的实时响应速度。实验结果表明,本文提出的项目聚类与SVD奇异值分解的混合推荐算法可以提高推荐系统的在线响应速度,从而有效解决推荐系统处理大规模数据面临的实时性问题。同时借助SVD奇异值分解增强了推荐列表的多样性,从而有效解决了用户对相似的推荐存在疲倦的问题。
其他文献
人工智能对社会经济和文化领域的发展产生了积极的效果,表现出了突出的变革性和引领性。在科研和学习中,将公式图片转换为La Te X代码是一项常见但耗时的任务。以深度学习算法模型为代表的人工智能技术可以有效地提升这一过程的效率。本文主要研究和搭建基于自回归深度神经网络的数学公式图片识别与La Te X代码转化模型。具体而言,我们分别基于seq2seq结构和Transformer结构搭建了两个具体的公式
学位
互联网的高速发展,给人们的生活方式带来了巨大的改变。从交流到购物都实现了线下向线下+线上的转化,各种线上教育平台也随着人们日益变化的需求而出现,海量的互联网用户运营数据,成为企业分析用户需求,提升利润的利器。而对于各类平台,用户数量往往远多于实际下单用户数量,面对形形色色的用户,传统的营销方法已经无法保证企业在竞争激烈的市场中脱颖而出。如何对大量的用户进行价值识别、细分用户群体、预测用户行为,有针
学位
“量化投资策略”是利用统计学、数学、信息技术、人工智能等方法取代人工做出决策,通过模型完成股票交易来构建投资组合,利用计算机技术和数学模型去实现投资策略的过程。相较于主观投资,量化投资策略的最大特点是其具有一套基于数据的完整交易规则,投资范围更加广泛,且程序化的交易方式能够避免人为主观因素的影响,采用计算机进行自动分析使得响应速度迅速,强大的数据处理能力和信息挖掘能力更有可能创造出有效的交易价值。
学位
目的 对小儿急性支气管肺炎患者使用氨溴特罗联合孟鲁司特钠治疗的效果进行探讨。方法 选取 2019 年 2 月—2021 年10 月期间中国人民解放军联勤保障部队第九六一医院收治的 66 例小儿急性支气管肺炎患儿为研究对象,根据随机抽样法分为两组,每组 33 例。常规组使用氨溴特罗进行治疗,研究组使用氨溴特罗联合孟鲁司特钠进行治疗,观察两组治疗效果(治疗有效率、症状消失时间、住院时间、血气分析指标、
期刊
<正>一、经典的涵义和阅读经典意义(一)"经典"的涵义杜甫在《戏为六绝句》中写道"王杨卢骆当时体,轻薄为文哂未休。尔曹身与名俱灭,不废江河万古流。"卡尔维诺在《为什么读经典》中这样表述:"经典是那些你经常听人家说‘我正在重读……’而不是‘我正在读……’的书。"博尔赫斯在《论经典》中谈道:"经典不是指一本书拥有这样或那样的优点。经典是指一本被世世代代的人们由于各种原因的推动,以先期的热情和神秘的忠诚
期刊
目的 分析选择性脊神经后根切断术(SDR)治疗痉挛型脑瘫患儿临床疗效及影响因素。方法 纳入2015年9月至2019年6月在上海市儿童医院行SDR的131例痉挛型脑瘫患儿,采用粗大运动功能分级系统(GMFCS)和粗大运动功能评分-66项(GMFM-66)评价术前及末次随访时粗大运动功能、改良Ashworth肌张力分级评价双下肢目标肌群痉挛程度,单因素和多因素前进法Logistic回归分析筛查GMFM
期刊
在我国努力实现碳达峰、碳中和的目标过程中,研究碳排放在经济集聚背景下的空间溢出效应以及数字经济发展如何影响城市间的碳排放水平、是否有利于降低碳排放量具有重要意义。通过梳理相关文献和理论研究,发现数字经济对碳排放的影响可能并不是简单的线性关系,而可能是复杂的非线性关系。本文采用文献法首先对国内外文献中关于数字经济和碳排放的概念界定、测度计算、影响因素三个方面的相关研究进行梳理,从中找出数字经济与碳排
学位
数学证明对于学生的发展及数学学科核心素养的形成具有重要的作用,学生应养成有条理、讲道理的习惯和严谨客观的数学思维。传统上,学校数学通常被分为代数与几何两个板块,数学证明往往只在几何部分受到重视。我国学生在高中阶段遇到的代数证明较多,而索莫尔霍夫认为学生认识数学证明是他们能够自行构建数学证明的重要基础,因此在高中之前学生对代数证明的认识,可能将直接关系到他们在高中阶段构建代数证明的表现。另一方面,研
学位
对数正态分布作为基本统计分布之一,主要应用于由于疲劳而引起损坏的电子产品的寿命变化规律,在多个行业中具有普遍的运用价值,在可靠性统计分析领域也具有深入的研究空间与研究意义。随着智能化的发展,大量高新科技产品随之出现,导致生存数据逐渐多样,失效数据的建模就需要针对性更强的统计分布。因此需要引入新的分布用做可靠性领域的研究。本文提出了一种新的寿命分布,将对数正态分布与泊松分布进行复合,得到一个新的复合
学位
我国在人口老龄化的背景下,未来二十年内,人口高龄化问题将日益突出,高龄老人将成为数量增长最快的年龄组。此外高龄老人比低龄老人更加需要日常生活方面的帮助,他们在医疗和其它服务费用以及公共福利和私人支付方面的需求远远超过低龄老人的需求,给我国社会养老施加了巨大压力,因此,本文将对高龄老人的余寿进行影响因素分析及预测,为国家或机构指定养老策略提供理论支撑。本文对于中国老年健康影响因素跟踪调查(CLHLS
学位