基于协同过滤的智能电商推荐平台的研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:fenglu84
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展和人们对电商的认可度日益升高,网上购物已逐渐成为生活中不可或缺的一部分。淘宝、京东等平台深耕C2C领域,自身壮大的同时也改变了传统商业营销模式,推动国内电商业务持续蓬勃发展。行业的进步带来了极大的利润和便利,但其面临的挑战也日益严峻。第一,“数据过载”问题。电商业务的蓬勃使得相关用户及商品数据呈爆发性增长,用户越来越难以从繁杂的数据中及时、精确地找到所需信息。第二,“冷启动”问题。新用户暂时没有相应的历史行为数据,平台无法通过预测向其推荐适配商品,即用户冷启动。物品冷启动同理。面对亟待解决的“数据过载”和“冷启动”等问题,个性化推荐系统应运而生。本文采用文档数据库mongodb,结合基于交替最小二乘(Alternating Least Squares,ALS)的协同过滤算法和二分K-均值(bisecting K-means)聚类算法,使用Spark、flume、Kafka等大数据技术,设计和实现了基于协同过滤的智能电商推荐平台。该平台结合离线统计榜、离线推荐和实时推荐多种推荐方式,聚焦于冷启动和数据过载问题,专注从纷繁庞大的数据群中为用户挖掘适配商品,高效获取有价值的信息。论文主要工作如下:(1)通过实习期间对电商行业的调研和推荐流程的分析,明确本平台的功能及性能需求,并从业务架构和技术层级两个角度进行全局概要设计和子模块的详细分析与设计。(2)针对数据过载现象,本文引入大数据架构,利用Spark、mongodb、flume、Kafka等工具构建高效数据流平台,并建立基于星型模型的业务数据仓库,以拉链表的形式分层级储存用户及商品的缓慢变化维度数据和行为数据,提升了数据存储和处理的效率。(3)以大数据平台为基础,本文利用基于交替最小二乘(Alternating Least Squares,ALS)的协同过滤算法和二分K-均值(bisecting K-means)聚类算法构建了用户-商品混合推荐模型,并引入热点因子,使用top N算法混合推荐。(4)为了解决用户冷启动的问题,本文采用离线统计推荐和新用户标签问卷的形式对新用户的数据进行补充。同时,在实现电商业务的基础上,参考lambda架构离线和实时混合推荐,完成基于协同过滤的智能电商推荐平台。最后,构建测试模型以检测平台的功能完成度及性能水平。
其他文献
近年来,我国环境污染问题依然严重,全国潜伏着许多污染风险,渐进、突发、大规模的污染事故频发。随着社会法治的发展,以及环境保护的宣传,人们对环境权利保护的认识正在提高,法律制度也在根据我国国情不断的完善。中国的环境诉讼数量也在不断增加,加强和改善现行的环境法律体系我们目前所迫切需要的。除此以外,参与审判的诉讼当事人是审判过程中最重要的因素。而在环境民事公益诉讼中,不同于其他诉讼主体,环境民事公益诉讼
速裁程序以提升诉讼效率为目标,具有兼顾公正与效率,保障当事人合法权益之功能。自设立以来,取得了很好的成效,缩短了办案周期,提升了办案效率,同时也使有限的司法资源得到了合理利用。但在实际运行中也存在一些问题。在适用率方面,该程序在试点阶段适用率尚可,但在正式确立后却有明显的回落趋势,主要原因在于办案人员不愿用、不善用速裁程序,以及对于适用条件的规定不够合理。在庭审过程中存在的问题较多:庭审形式化现象
非诉行政执行是指经法院审查直接进入到执行程序,且作为该执行依据的具体行政行为并没有经过诉讼程序的执行制度。我国非诉行政执行制度在执行环节仍存在一些争议,目前法律规定,多数行政机关需要向人民法院提出申请进行强制执行,经人民法院审查后的执行主体归属问题,实践中做法不一。2012年在国有土地房屋征收、土地违法执行领域规定了裁执分离制度,首次拉开了非诉行政执行裁执分离的帷幕。之后有部分地方在其他领域开始尝
非法实物证据排除规则尚处在建立之后的完善阶段,其立法现状和司法现状都不容乐观。非法实物证据排除规则在2010年通过《非法证据排除规则》首次面世,并通过立法进行了规则细化,但未有实质性进步,排除规则仍停留在原则性规定。在司法实践中的价值追求上更加倾向于追求实体正义,立法方面仍存在非法实物证据的界定不明、实物证据范围狭窄、与瑕疵证据易混淆的不足之处。除此之外,取证禁止性规范的缺失、排除非法证据的证明责
卫星组网是海洋环境安全监测的一种重要方式,由于卫星能力的多样性,同一个监测任务下会产生多种卫星分配调度方案。对卫星调度方案实施合理的评估与决策,从而辅助决策者遴选出一个较优方案已成为卫星组网研究的关键问题。目前对于卫星组网系统评估决策的研究还相对较少,因此本文以卫星组网调度方案作为评估决策的对象,针对卫星组网调度方案评估决策方法进行研究。本论文主要完成的工作有:1.根据卫星组网常态化监测任务和应急
本文论述的在线庭审,是指庭审各方主体利用电子信息技术进行沟通进而完成质证、辩论等庭审环节的一种新型庭审机制。2021年最高院发布的《关于人民法院在线办理案件若干问题的规定(征求意见稿)》的草案,标志着在线庭审规则已经具备从互联网法院推行到普通法院的条件。但互联网法院的在线庭审规则建立在“涉网案件”的逻辑前提下,是基于在线庭审与电子商务纠纷属性相匹配这一规律下的产物。所以互联网法院的在线庭审规则具有
当前,公平与公正待遇条款已成为国际投资条约中很常见的一项外资待遇条款,但各国在国际投资条约中往往对该条款进行语义抽象的设计,这使得该条款的内涵与适用范围远未达成统一,进而不同的国际仲裁庭对该条款的解释也具有差异性。以上种种现象使得国际投资条约中的公平与公正待遇条款成为国际投资仲裁实践中最具争议的条款之一。本文除绪论和结论外由三部分组成。第一部分首先分析了公平与公正待遇条款的概念;其次对国际投资条约
民事诉讼庭前会议制度是民事审前程序的重要环节,是实现案件繁简分流的重要手段。在法官员额制改革和立案登记制改革的推动下,我国立案数量不断上升,法院案多人少的矛盾依然严峻。2015年最高人民法院关于民事诉讼法的司法解释正式确立了民事诉讼庭前会议制度。民事诉讼庭前会议制度通过证据交换、明确争议焦点、庭前调解等方式,帮助法官实现积极的案件管理,保证案件集中审理和促进和解,同时也为民事纠纷提供了多元化的解决
目前,人们习惯用手机相机记录生活,而且图片是记录信息的一种重要媒介,因此图片在手机相册内大量存在,开发一款辅助用户拍照的相机和能够高效管理手机相册内大量图片的系统有着积极意义。手机应用商店内相机类应用的主要功能都是美颜和滤镜角度,优化用户拍摄的照片,很少有涉及到提示用户如何拍照的功能。部分图片管理类应用只是基于图片的时间和地点分类,也有基于图片内容进行分类的应用,但是该类应用大多数都会要求用户将图
物联网(Internet of Things,IoT)是日常物理对象或事物的网络,物联网设备之间的数据获取和传输是物联网通信和网络技术的基本前提。在物联网中由于网络本身以及数据的特点,针对物联网的路由协议研究尤为重要。传统的路由协议进行路径选择时一般只考虑路由度量,鲜有考虑过数据包属性(例如:大小、编码等)。针对上述问题,本论文提出了一种路由度量和数据包属性相结合的物联网路由选择策略,并设计与实现