电子商务协同过滤算法设计及实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:suals
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据呈爆发式增长,如何从海量数据中深度挖掘隐藏的价值是一项研究意义深远的课题。在十三五规划中,国家将大数据分析应用列入国家战略层面,数据即是价值。在大数据背景下,电子商务进入了更加多元化的发展时代,网站后台可以挖掘用户的消费或是浏览记录,建立用户消费偏好模型,结合推荐技术将优良的商品推荐给客户,从而减少消费者搜寻自己真正喜爱商品的时间和精力,最终缓解信息过载问题。在电子商务类网站中,每天都会产生海量的数据,推荐系统需要挖掘分析的数据十分庞大。如何快速、准确的响应用户需求,这就要求推荐系统具有强大的数据挖掘分析能力。本文结合数据挖掘的经典算法——协同过滤算法,深入研究了基于用户和基于项目的推荐算法,并针对这些算法存在的不足做了改进,实现了组合推荐算法。主要研究工作包括以下几个方面:(1)研究了数据挖掘技术的概念、分类、数据挖掘的操作过程,分析了基于数据挖掘的Web数据挖掘的概要、种类与数据源,深入研究了协同过滤技术的基本概念、优势以及协同过滤的原理及操作过程。(2)详细研究基于用户的协同过滤算法(User-based CF)和基于项目的协同过滤算法(Item-based CF),这两种算法在推荐系统中使用最早也是应用较为成功的推荐算法。在电子商务类网站中,User-based CF算法主要用于分析网站中用户之间的关系,通过挖掘分析用户之间的相似度来进行商品推荐;Item-based CF算法可用于分析用户的历史消费记录。(3)针对单一推荐算法的性能缺陷,本文研究了矩阵分解改进方法、基于内容的优化方法和三种混合推荐技术,包括多段组合混合推荐框架,加权型混合推荐技术以及瀑布型混合推荐技术。通过优化这几种混合推荐技术,可以有效的解决冷启动、稀疏性等问题。本论文实现了基于传统协同过滤算法、基于内容的混合推荐。(4)研究了大数据处理框架Spark分布式计算框架,利用Spark的编程模型设计并实现了改进后的协同过滤算法——混合推荐算法,结合Spark的并行化计算优势,提高算法的推荐效率。(5)利用推荐系统的多项评价指标,将数据集划分为训练集和测试集,设计了推荐系统的测评实验,并对实验结果进行了详细分析。
其他文献
中国,是白酒的王国。数千年的白酒酿造历史在造就了世界上最大的烈性酒消费市场的同时,也使白酒拥有了全球数量最多的”粉丝”。所以,当上个世纪90年代初,人头马与马爹利飘洋过海
今年7月,“淘化大同”这个代表着高品质调味品的金字招牌将迎来100岁的生日。仍然坚守在品牌起源地的厦门淘化大同调味品有限公司准备举办一场庆祝盛典,公司副总经理赵旭云告诉
【正】 各市人民政府,省政府各厅委、各直属机构:经省政府同意,现将省林业厅制定的《辽宁省林业生态建设发展规划纲要》和《辽宁省林业产业发展规划纲要》转发给你们,请认真
石榴(Punica granatum L.)为石榴科石榴属植物。石榴皮是石榴的干燥果皮,多年研究表明石榴皮具有显著的抑菌、抗癌、抗病毒,抗氧化等作用。石榴皮作为天然抗氧化剂,来源广泛
时代的发展使得当前各行各业人才的培养已经远远不满足于课堂教学,尤其是对于审计专业的应用型人才培养来说,教师应当将理论结合实践,注重学生的实际操作能力,积极整合课内外
天津市简称津.它既是我国四大直辖市之一,又是环渤海地区经济中心,还是北方最大的沿海开放城市。天津现辖13区5县。全市面积11305平方公里,其中市区面积4276平方公里.全市常住人口
就在长沙秋季糖酒会召开之际,五粮液旗下的战略主导性品牌六百岁古酒不声不响地在浙江温州发起了一场“变脸”风暴。2008年10月16日,浙江三瀛酒业有限公司及其下线商家拉开了六
高速增长2005年.葡萄酒.尤其是干型葡萄酒,出现了近乎“井喷”的需求增长局面。几乎所有葡萄酒厂的销售收入都出现锰长,不少主要品牌增幅达30%以卜。
20世纪80年代以来,全球高等教育改革不同程度地显现了市场化的特征。随着我国政治经济体制改革的进行,高等教育投资体制也随之进行了改革,改革具有明显的市场化特征。
<正>经济新常态下,票据市场发展面临多重机遇:经济结构优化有利于扩大票据规模增长空间,稳定的货币政策有利于增强票据市场资金交易活力,混业经营有利于推动票据业务跨市场发