用户行为分析算法及其在Spark上的应用研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:allench9484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,大数据已经成为时代的热点之一。在此背景下,网络用户行为数据量急速增长,而商家迫切需要通过对这些数据分析来了解用户的兴趣爱好,以便于向用户做精准的广告投放和适合用户需求的个性化推荐来达到利润最大化的目的,而用户也需要商家对自己的行为数据分析之后,有针对性的提供用户自身感兴趣的信息,从而享受更加便利快捷的服务。目前,已经有许多学者对用户行为分析做了相关研究。然而在数据量日益增大的情况下,传统的数据库技术已经难以满足需求,近年来,各种大数据技术应运而生,Hadoop、Spark等平台为处理海量的用户行为数据提供了技术支撑。本文在研究了神经网络的多种学习方法后,针对基于梯度下降算法的神经网络收敛速度慢,易陷入局部最优问题与基于进化算法的神经网络计算量过大的缺点,提出了一种使用BSA算法改进神经网络的算法——BSANN算法。BSANN算法利用群智能算法计算简单的特点来加快神经网络的学习速度,全局搜索能力强的特点提高神经网络的准确率,同时利用BSA算法中的迁移概念避免了陷入局部最优解的问题。在此基础上,本文对电商网站的用户行为数据进行了分析,建立了相应的神经网络模型并从其中提取了神经网络的输入特征,对用户的消费行为进行预测。通过训练与测试,将BSANN算法与BP算法的效果进行了对比,验证了BSANN算法的可行性和有效性。本文基于以上研究,将BSANN算法并行化,在Spark平台上完成运行,设计实现了基于Spark的用户行为预测系统。该系统以鸟群优化算法改进的神经网络算法BSANN算法为核心,预测电商网站用户的消费行为。
其他文献
目的中医护理对肾结石术后患者的应用效果观察。方法抽取100例肾结石手术病人进行探讨,随机分组,对照组采取一般护理干预,治疗组采取中医护理干预。结果通过对比两组的治疗时
为了探明东南亚茄子资源的耐热性和对青枯病的抗性,筛选抗性材料,为茄子种质资源的利用提供依据。利用茄子苗期耐热性快速鉴定体系和浸根接种法对8份自交系和13份东南亚茄子
目的:通过观察黄芩苷对乳腺癌移植瘤的抑瘤作用及对肿瘤组织毛细血管通透性、血清丙二醛(MDA)、肿瘤组织赖氨酰氧化酶(LOX)等相关指标的影响,探讨黄芩苷对肿瘤缺氧微环境的作
父母效能训练是山东省青岛二十七中学开展家校活动引入的新课题,其目的是让受训的父母掌握沟通的主要核心概念和基本技巧,获得自我的心灵成长,并最终改善亲子关系,促进孩子的
通过对"珠海体外循环管道事件"进行剖析,阐述我国医疗器械不良事件监测与风险管理的现状,探讨我国实施医疗器械不良事件监测与风险管理的模式和发展方向。
本文从全球气候变暖在各地的反应出发,论述了全球气候变暖的成因,阐述其可能对农业、全球气候、生态系统以及陆地面积等方面产生的影响,进而提出一些可行性意见。
稀磁半导体材料可以同时利用电子的电荷和自旋这两个自由度作为信息载体,是自旋电子器件的关键材料,拥有广阔的应用前景。目前稀磁半导体材料面临的两个关键问题是磁性的产生
乙酸乙酯是啤酒中含量最高、最重要的酯类,能赋予啤酒水果香味。作为啤酒中重要的风味物质,其形成机制以及影响因素的研究,对于啤酒生产与风味控制具有重要意义。本文主要论
量子点(quantum dots,又称半导体纳米晶)由于其所具有的优异光学性质,越来越受到人们的重视,尤其是在生物检测领域中,其应用前景更加广泛。CdTe量子点由于其发光范围较易达到
研究背景和目的高血糖(hyperglycaemia)在急性心力衰竭(acute heart failure,AHF)患者中很常见,研究显示入院血糖(admission glucose,AG)升高患者伴随高死亡率。但大多研究纳