基于聚类与加权矩阵分解的推荐算法研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:ahphone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现与普及给予了用户更多的可访问信息,满足了大数据时代的信息需求,但随着互联网的快速发展,信息呈现爆炸性增长和扩张,信息结构日益复杂,形成“信息超载”(information overload)问题,普通用户获取感兴趣的内容和商品的难度和成本相应增加。信息量的增大,反而对信息利用率施以反效果。个性化推荐系统被认为是解决上述问题的最有效工具和方法之一,自被提出以来,得到快速发展,能从动态变化的信息流中更准确的拣选出满足用户实际需要的商品与内容,从而在一定程度上缓解甚至解决了“信息超载”问题。推荐算法作为推荐系统的核心,对推荐效果有着根本性的影响,随着网络技术的发展,各种推荐算法应运而生,并取得了显著的效果,然而仍旧存在一些问题,尤其是在大数据背景下推荐系统中所存在的推荐效率低下、扩展性差、推荐质量不高等问题逐渐显现,亟待解决。本文针对以上问题提出一种结合聚类与矩阵分解的融合算法,具体的工作如下:(1)基于Bregman距离的联合聚类算法挖掘出具有相似特性的低秩评分子矩阵。通过组合不同约束集、不同聚类计算方式、行列类簇数量等配置来挖掘出多样的、不同层次的评分子矩阵,为后续多模型融合做好铺垫。联合聚类算法拆分原始评分矩阵,提高整个推荐算法的并发度与扩展性,缓解算法的高开销问题。(2)在各个模型的子矩阵上并发地进行矩阵分解,在矩阵分解阶段采用SVD++算法,基于每个子矩阵中的评分分布计算加权策略,给予高频评分较大权值,通过牺牲小部分数据使模型向评分矩阵的高频评分部分倾斜,以此来缓解子模型数据不足而产生的欠拟合等问题,提高对大多数评分的预测精度,从而在一定程度上提高推荐性能。在梯度下降阶段,引入学习速率函数控制学习速率的更新,提高了算法的效率。(3)聚类算法确定聚类中的评分分布,多个异构的聚类产生子矩阵中的评分分布不同,即根据不同的聚类结果训练从而得到不同的子模型。本文采用子模型均值融合方式将多模型融合成单一的模型进而输出推荐结果,使基于不同聚类的推荐结果达到互补的效果。通过实验证明,本文所提出的算法与三种基线算法相比,在均方根误差(RMSE)与平均绝对误差(MAE)上均有明显降低,换句话说,推荐的质量大大提升,推荐效率也相应提高。
其他文献
纤维混凝土是近年来发展起来的新型复合材料,目前国外发达国家应用较广泛.文章运用工程实例阐述聚丙烯纤维双掺混凝土的特性和施工要点.
近年来,电动汽车行业的蓬勃发展给涡旋压缩机的发展带来了前所未有的机遇,内置式油气分离器对压缩机的安稳运转起着至关重要的作用。油气分离器的作用是分离排气腔中制冷剂气体夹杂着的润滑油,避免过多的润滑油进入制冷系统从而影响换热效率;分离回收后的润滑油不仅对压缩机起到润滑与密封的作用,而且润滑油回收不足将导致背压力减小,最终影响动涡盘的平衡。本文以电动涡旋压缩机油气分离器为研究对象,采用数值模拟方法模拟计
合同解除制度是合同法中的重要制度,与合同解除相关的问题一直是民法理论研究的重要问题。“损害赔偿之债在实务上最称重要,万流归宗,民法上之问题,实以此为核心。”损害赔偿体现
阳台是居民接触自然的中介空间.封闭阳台是目前特定历史条件下的现象,主要是为改善居住环境,创造更多的功能空间.其存在价值在于满足了居民对住宅物质和精神功能的需要.为此
全球领先的照明控制系统专家路创,日前结束了在北京、上海、广州和香港四大城市的巡回展览,重点推介其照明与窗帘控制方面的创新成果,并展示旗下最新产品与照明控制技术。路创通
本文以大体积混凝土施工质量作为研究对象,从技术控制、现场控制、制度控制、试验室控制四个方面阐述大体积混凝土质量控制的方法,并借助实例分析、讨论。从混凝土原材料控制
<正>~~
期刊
人类对于飞行的研究源于对飞行生物的敬畏和嫉妒,在近十年间,越来越多的研究者把眼光投向FWMAV领域,取得了令世人瞩目的成果。众多自然界飞行昆虫可控的灵活机动,科学家们自
新年的钟声刚刚敲过,我便急忙拨通父母的电话,向千里之外的父母拜早年.因为工作的关系,今年春节我没能回家过年,估计这会儿老两口一定挺寂寞的.可和母亲唠了一会儿,仍未听到
期刊
案例摘要:据《民主与法制》报道,建于2000年的凤凰山庄小区,位于长沙市岳麓山下的桃子湖畔,依山傍水,风景优美。然而,2009年2月,长沙市政府的一纸&#39;土地收回决定&#39;,打
期刊