基于谱聚类和动量优化的推荐算法研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:hnlh007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展和普及,互联网用户和社交内容的规模爆发式的扩大,逐渐走向信息过载的时代。这时,在信息的过滤和筛选上,推荐系统展现出了强大的优势。它通过对用户个性化的服务来有效的提高客户体验,提升企业服务质量,实现在为企业带来巨大的经济效益同时,为用户创造价值。目前推荐系统大致可分为三大类:基于内容的推荐系统(Content Based Recommender System,简称CB)、协同过滤推荐系统(Collaborative Filtering Recommender System,简称CF)和混合推荐系统(Hybrid Recommender Systems)。在众多推荐算法中,协同过滤算法因其形式简单、推荐效果良好,得到了广泛的应用,而隐语义模型(Latent Factor Model,简称LFM)推荐算法是其中的一种。本文主要以LFM算法为基础,进行分析优化。本文深入分析了隐语义模型推荐算法,随机梯度下降(Stochastic Gradient Descent,简称SGD)算法是其基础的核心算法,根据求参数偏导找到最速下降方向,通过优化迭代获得解。有学者提出带参数的批量学习算法,通过加入了冲量和中间动量来提高学习速率、降低学习时间。本文把深度学习领域应用比较广泛的涅斯捷罗夫梯度加速(Nesterov Accelerated Gradient,简称NAG)引入到LFM算法中,提出了基于NAG动量优化的隐语义模型推荐算法N-LFM(LFM Algorithm Optimization based on NAG),在带参数的LFM推荐算法的基础上再设计一个校正因子,用在动量项迭代求取过程,改进后的算法能够实现矩阵还原的迭代过程加速,实现加速收敛、提升推荐算法精度的效果。此外,考虑到推荐效率的问题,本文提出了基于谱聚类(Spectral Clustering,简称SC)和NAG动量优化的推荐算法CF-NLFMSC(CF Optimization based on N-LFM and SC)。算法在推荐前加入谱聚类算法,而传统的基于聚类的协同过滤推荐技术通过K-Means聚类算法对用户或项目进行聚类,但是本文采用谱聚类算法解决其效果不稳定等问题。通过谱聚类算法的加入,缩小了查找近邻用户的空间,从而有效地减少计算量,改善推荐系统的稀疏性、可扩展性及推荐实时性。改进后的算法能加速数据聚类、减少计算量,实现更好的推荐效果。本文完成算法设计后,首先在Movie Lens数据集中进行了实验。经对比验证,本文提出的CF-NLFMSC算法相对于原算法在Movie Lens100K的数据集的实验中,准确率和召回率上分别提升了2.22%和1.26%,反映出改进算法能够达到更高的准确度;覆盖率提升了4.02%,表示为用户推荐的可选择的商品较多,也就意味着用户的满意度更可能提升;流行度降低了1.09,表示算法能够更多地为用户推荐相对更冷门的物品,对挖掘冷门物品有更好的表现。另外,算法在1M的Movie Lens数据集、Film Trust数据集和Netflix数据集的测试中,依然表现良好。在Movie Lens1M数据集中算法准确率和召回率分别实现了最大到2.94%和14.64%的提升,在Film Trust数据集的Top-10推荐中准确率和召回率分别提升了6.79%和10.34%,在Netflix数据集的Top-10推荐中准确率和召回率分别实现了1.5%和1.66%的提升。验证了改进算法的可行性和有效性,具有实际应用推广价值,同时为深入改进推荐算法有指导作用。。
其他文献
癌症,即恶性肿瘤,包含上百种相关病症,其治愈率低、致死率高,而“谈癌色变”也说明其对人类健康的“杀手”地位。治疗癌症对人类来说任重而道远。传统方法主要以配合强细胞毒
土壤磁参数测量具有快速和非破坏性等优点,目前被用来指示和评估土壤侵蚀、排水和重金属污染等。土壤碳库是最大的陆地碳库,估算土壤碳库储量和绘制高空间分辨率的碳库分布图
番茄花的正常发育对于种子的发育和果实的品质具有非常重要的作用。花粉的萌发和花粉管伸长是番茄成功双受精的前提,同时花粉的正常萌发在番茄受精过程中起到重要的作用。因
兔球虫病(rabbit coccidiosis)是由艾美耳属(Eimeria)或等孢属(Isospora)球虫寄生于兔的小肠或胆管上皮细胞内所引起的一种家兔最常见的体内寄生虫病。该病分布广、传播快、致死率高,对不同品种、年龄的兔均具有易感性,特别是断奶后至3月龄内的仔兔最易感染,给养兔业造成极大的危害,带来了巨大的经济损失。目前公认的兔球虫的种类有11种有效种,11种有效种包括斯氏艾美耳球虫(E.
目的:探讨体外冲击波碎石联合震动排石床对肾下盏结石的有效性及安全性研究。方法:对于就诊于川北医学院附属医院的肾下盏结石患者1 19例,按随机方法分为体外冲击波碎石组及冲击波碎石联合震动排石床组。实验组为冲击波碎石联合震动排石床组,该组患者在体外冲击碎石后辅助两次机械振动排石床治疗。对照组治疗方案仅为体外冲击波碎石。分别于碎石后当天及1周及1月评估纳入研究对象排石效果。排石效果判定主要借助于超声及腹
目的:通过对广西少数民族农村地区居民的调查,了解广西少数民族农村地区食源性寄生虫感染状况,研究和分析食源性寄生虫感染的个人生活饮食行为因素,家庭因素和自然村因素及个体生活饮食高危行为的人群分布。为制定广西少数民族农村地区针对性的食源性寄生虫防治策略提供依据。方法:采用分层和整群抽样的多阶段抽样方法获取调查对象,使用自制的《居民个人情况调查表》、《家庭情况调查表》和《自然村情况调查表》进行入户调查,
端刺作为CRTSⅡ型板式无砟轨道重要组成部分,设置在路桥过渡段。端刺在服役过程中主要起到锚固底座板温度力的作用以及承担列车荷载的作用。由于端刺结构主体为混凝土,现有的研究表明,外荷载作用下端刺开裂的可能性很大,裂纹会严重影响混凝土结构的耐久性。因此本文以CRTSⅡ型板式无砟轨道端刺为研究对象,基于损伤力学、断裂力学理论,通过有限元仿真,对温度力、路基不均匀沉降等工况下端刺裂纹萌生规律与扩展规律进行
目的:通过耳穴综合诊断法观察临床胰腺癌患者右耳耳廓相关耳穴的特异性变化,探讨耳穴诊断法对于辅助诊断胰腺癌患者的临床可行性及后续研究价值。方法:根据既往相关文献与理论基础,选取了右耳耳穴胃、胰胆、脾、内分泌、肿瘤特异区Ⅰ、Ⅱ、Ⅲ共7个耳穴,采用耳穴望诊法、耳穴触诊法及耳穴电测定法联合的综合诊断法,对符合胰腺癌诊断标准的61例胰腺癌患者以及60例不符合胰腺癌诊断标准的非胰腺癌健康者进行观察。耳穴电测定
鳜鱼(Sinipercachuatsi)是我国传统的名贵鱼类,随着集约化养殖规模增加,养殖密度增大和水体环境的恶化,鳜鱼的病害问题日益严重,目前已成为威胁我国鳜鱼养殖业健康发展的主要因素。其中由嗜水气单胞菌(A erom o nas hydrophila)引起的败血症常造成鳜鱼大批死亡,给养殖户造成了巨大的经济损失。本实验开展了嗜水气单胞菌对鳜鱼的致病性研究,建立了嗜水气单胞菌的环介导等温扩增技术
隐喻是文学作品中的一颗明珠,对文学作品的翻译从来离不开对隐喻翻译的探讨。随着隐喻认知观的确立,我们对隐喻翻译的深层问题,如翻译策略与语境要素之间的关联、隐喻翻译的合理评价标准等也逐渐形成新的认识。简·奥斯汀在《傲慢与偏见》中利用半隐式或全隐式喻体,将本体与喻体巧妙地融合在一起,省去不必要的直白文字,使其语言简洁含蓄,耐人寻味。这种隐喻来源于简·奥斯汀独特的个人感受和体验,目的在于使表达更加丰富、准