基于大数据的商品混合推荐系统

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zyff1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的成熟发展,我们也逐步迈入了大数据时代,“信息过载”问题则成了我们每天必须面对的问题。推荐系统在这样的背景下诞生并不断发展,近几年来企业对推荐系统的需求也日益增长。普通用户面对这样的数据往往不知所措,对于那些用户难以明确表达出来的需求,推荐系统能够分析用户所产生的各种各样的数据,帮助用户去过滤信息,从而与用户一起发掘出他们所需要的内容。不管是在电子商务、广告的投放还是社交平台,推荐系统都扮演着重要的角色。本文首先研究了相关技术背景,传统的计算架构和存储设计并不能满足推荐系统的要求,面对这些数据,要求系统能够快速响应用户需求,因此推荐系统必须具备强大的数据处理能力。目前大数据处理框架有很多,从最初的Hadoop到后来的Storm、Spark以及最新的Flink,是一个从批处理到流处理的发展过程。大数据处理也分为了离线和实时两个模式,从而为不同的需求场景提供合适的处理方式。此外,数据量的增多也使得数据仓库技术得到快速发展,使用数据仓库建模理论存储海量数据能够有效提升数据的使用与管理效率。随后本文探讨了大数据计算技术和大数据存储技术选型,除了上述提到的几个计算框架,也包括了列式数据库HBase、分布式文件系统HDFS、数据仓库工具Hive等相关大数据存储技术与工具。推荐算法方面,本文首先陈述了一些在推荐系统中经常被使用的算法,并创新提出了基于动态感知的内容推荐算法和动态权重混合推荐算法,将Ebbinghaus遗忘曲线引入相似度计算,并将各推荐服务的结果通过动态权重的方式加以调整并混合,避免单一算法带来的冷启动、稀疏数据等问题,提升个性化推荐效果,使用Amazon的商品数据集对系统的推荐算法的运行时间、准确率和召回率等指标进行测评,验证其可行性与有效性。最后设计并实现了基于大数据的商品混合推荐系统。系统能够对推荐需求作出快速响应,基于动态感知的内容推荐算法比普通的用户反馈推荐拥有更好的效果,并且本文提出的动态权重混合方式比线性混合也拥有更好的性能。
其他文献
近年来,国内外企业因财务丑闻、环境污染和剥削劳工等问题导致效益下滑甚至破产的事例屡见不鲜,因此社会各界对企业的社会责任活动高度关注。企业的目标是实现价值增长,而现有文献对企业履行社会责任能否提升财务绩效的研究仍存在争议。同时,企业自身及外部投资者都十分关注企业的盈利质量情况,因此构建更加全面合理的盈利质量体系来衡量企业价值,寻找履行社会责任与企业价值关系的突破口,实现企业履行社会责任能够提升企业与
在求解时间相关的偏微分方程的高阶隐式方法、控制理论、结构动力学、量子色动力学(QCD)等科学计算领域中,都会遇到求解大型稀疏移位线性系统问题。在数值计算中,如何快速高效地求解线性系统已经成为研究的重要方向。目前,求解移位线性系统的主要方法为Krylov子空间方法,因为其具有存储量少、计算量小且可以利用Krylov子空间的移位不变性,一次性求解多个线性系统等优点,逐渐成为研究的热点方向。GMRES算
随着人口老龄化的加剧,与年龄相关的疾病如阿尔茨海默症、帕金森等疾病的相关问题慢慢引起了人们的关注与研究。通过研究大脑年龄,可以对与衰老相关的疾病做到尽早诊断和预防,因此是一项非常重要且具有意义的研究工作。目前大脑年龄的研究主要借助核磁共振图像(Magnetic Resonance Imaging,MRI)和脑电图(Electroencephalogram,EEG)来分析个体估计年龄与实际年龄的差异
随着物联网时代的到来,在智能家居、智慧工厂和无人车间等室内环境下,通过分布式传感器可用实现对设备的智能控制,极大丰富和便利了人们的生活。然而,如何保证室内大量分布式传感器长时、稳定的能量供应,是能否实现万物互联的关键。近年来,出现了一种腔体谐振无线输能技术,通过在谐振腔内激励出磁场,使接收器与磁场产生共振耦合来传输能量。相比于其他无线输能方式,该技术的能量传输距离远、传输范围大,同时还具有能量传输
随着互联网中用户数据的爆炸式增长和机器学习在各个领域的迅速扩张,用于解决婚恋交友问题的相关智能推荐算法也日趋活跃。本文以研究婚恋系统中智能推荐算法为课题,重点研究了具有较高准确率、泛化能力以及鲁棒性的婚恋推荐算法和婚恋系统中用户冷启动问题的解决方案,并以网站的形式将算法研究与应用结合起来,为用户推荐一组候选人。主要工作分为三个部分:1.提出一个具有更高准确率、泛化能力以及鲁棒性的SPWB算法。SP
随着物联网应用的发展,移动终端用户数量与日俱增,为了分析和处理物联网大数据,移动边缘计算(MEC)提供了便捷高效的通信与计算平台。然而,面对海量用户设备的通信连接,分布式移动边缘计算系统中存在着算力不足、数据隐私安全保护问题。为了解决这些挑战,通过采用联邦学习技术辅助多用户协同计算。移动边缘计算与联邦学习的融合是当今通信领域中的一个研究热点。因此,本文基于联邦学习构建多用户协同的MEC系统,通过分
脊椎动物衰老是复杂和缓慢发生的过程,在形态和生理上均表现出器官异质性,主要表现为组织和生理功能的完整性丧失,导致生理功能受损和死亡率增加;且衰老过程受到复杂的机制调控。近几年来,不同研究组以小鼠为模型,开展了一系列针对不同年龄的小鼠在组织水平和单细胞水平基因表达变化的系统性研究,以深入探索衰老调控机制。但现有研究缺乏对具有不同衰老特征的神经组织如海马与皮质的刻画,也缺乏细致深入的调控机制探讨和细胞
在印制电路板(Printed Circuit Board,PCB)的制造过程中,电沉积铜是实现通孔互连的关键技术。目前,为满足5G时代下通信和数据的高速大容量传输需求,背板的设计趋向于大尺寸、超多层、高厚度和小孔径化,导致通孔厚径比不断增大,使实现通孔内铜的均匀电沉积变得越来越困难。对于高厚径比通孔,电沉积过程中孔中心电流密度会远低于孔口电流密度,往往导致孔中心与孔口镀层厚度差异大,难以实现通孔的
传统的成本性态理论认为,在相关范围内变动成本总额随业务量的变动成正比例变化。而随着这一理论研究的深入,学者们通过实证研究发现成本的边际变动比率在业务量不同变动方向上存在着不对称性,即存在成本粘性。成本粘性的发现对传统成本性态理论的发展提出了新的挑战,学者们开始从全新的角度去理解成本变动的规律。目前各国学者们从不同的角度、不同领域针对成本粘性问题进行了大量的研究,主要包括成本粘性的存在性、特征和影响
荧光是物质吸收光照或者其他电磁辐射后发出的光,在医药、生物、农业、工业、环境科学等领域有广泛的应用。与无机荧光材料相比较,有机材料结构多样,并具有良好的可调性。其中,有机吡啶盐吸引了广大研究者的目光。4-(4-二甲基氨基苯乙烯基)甲基吡啶对甲基苯磺酸盐(简称DAST)作为一种重要的有机吡啶盐,除了具有优异的非线性光学特性,还具有明显的荧光特性,但是目前对其荧光的研究不系统、不深入。为此,本论文研究