【摘 要】
:
随着互联网的快速发展,web2.0、物联网、电子商务等已经深入到我们生活的方方面面,信息也呈爆炸式增长,如何从海量信息中找到对自己有用的信息,成为一个非常困难的问题,而解
论文部分内容阅读
随着互联网的快速发展,web2.0、物联网、电子商务等已经深入到我们生活的方方面面,信息也呈爆炸式增长,如何从海量信息中找到对自己有用的信息,成为一个非常困难的问题,而解决这个问题的一个最直接有效的方法就是推荐引擎。然而,随着数据量级的不断增大,传统基于单机环境下的推荐引擎已经不能满足企业的要求,将大数据相关技术引入推荐领域已经成为一种趋势,因此本文提出了基于Hadoop平台和Mahout框架的推荐引擎的设计与实现。本文首先对所使用的大数据核心技术进行了分析,然后对推荐引擎的基本框架及主流的推荐算法进行了研究,分析了推荐引擎中的几个关键问题,如可扩展性问题、数据稀疏性问题和冷启动问题,并针对这几个问题提出了相应的解决方案。重点研究了基于用户的协同过滤算法,分析了该算法所存在的不足之处,传统的基于用户的协同过滤算法在计算用户相似度时,只考虑用户对物品的评分等级,而忽略了用户对物品的评分时间,只考虑用户单方面的相似度,而忽略了用户与物品之间的潜在联系以及用户自身特征属性信息对推荐结果的影响,针对以上问题,引入时间衰减函数、偏好度函数和用户特征向量对传统的基于用户的协同过滤算法进行改进,并结合MapRedce思想和Mahout机器学习框架对改进后的算法进行分布式处理,同时完成了Hadoop集群的部署和Mahout机器学习框架的搭建,采用真实的电影数据集对改进后的算法进行了一系列对比实验,实验结果表明,本文提出的改进算法可以明显提高推荐的准确度,基于Hadoop平台上运行的分布式推荐算法,其执行效率较传统单机推荐算法得到明显的提升。本文最后使用改进后的基于用户的协同过滤算法,并依托大数据平台和电影数据集,设计并实现了一个电影推荐引擎原型,主要完成了系统整体架构的设计、系统执行流程的设计,系统各个部分所对应数据库的设计和系统功能模块的设计,最后对电影推荐引擎进行测试,测试结果表明,系统各个功能模块运行正常,性能和体验良好。
其他文献
随着日益增大的市场竞争压力,以及日新月异的新产品新技术,企业在推出新产品的时间和周期也越来越短。一个企业是否可以在与同业企业之间的竞争中取得优势并抢先占领市场,适
随着无线通信技术的发展,射频电路和集成电路变得越来越复杂,多功能电路模块被封装在集成的空间中,电路之间信号的相互耦合以及自由空间信号的干扰和串扰对射频电路的设计提
现今图像库日益庞大,相应的图像检索需求逐渐增加,对该课题的探索和研究迫在眉睫。如何从庞大的图像数据库中,在极短的时间内,快速高效地对需求的图像进行检索和定位,成为了
中华按蚊(Anophelessinensis)属于双翅目(Diptera)蚊科(Culicidae)按蚊属(Anopheles genus)按蚊亚属(Anopheles subgenus)的赫坎按蚊种团的(Anopheles hyrcanus group)是我国
随着互联网技术飞速发展和网络信息爆炸式增长,社交工具智能化和便携化,导致大量信息以短文本形式出现。例如微博评论、手机短信、聊天软件和自动问答系统。短文本相似度的计
借助贵金属的表面等离激元共振调控纳米材料特性一直是研究热点,两者不仅作用形式多样,而且涉及众多有趣的机理。为了探究它们之间的相互作用机理,本文以金银合金纳米颗粒(AN
橡胶籽是一种具有潜在经济价值的热带作物资源,其内含丰富的营养物质,如不饱和脂肪酸、维生素、酶类等。同时,橡胶籽中含有的氰化物、脂类等成分却增加了橡胶籽的不稳定性。
商事登记制度的建立目的是为了创造一个公正公平的市场经济环境,使商事主体在良好有序的市场环境中开展公平竞争,让整个社会市场经济处于良性循环当中。2012年广东省深圳、珠
集成电路的制造流程中,随着工艺节点的不断进步,化学机械研磨正变得越来越重要。而化学机械研磨是非常依赖于图形的一种工艺,在后段的铜互连工艺中,必须填充大量的冗余金属图形,来保证化学机械研磨在不同芯片位置的均一性。传统的基于规则的冗余金属填充方法,提供了一种简单快捷的填充方式,尽可能多地在芯片中填充冗余金属图形,提高芯片各个位置的图形密度,同时也减小了图形梯度。但是大量的冗余金属会导致耦合电容大幅增加
目的:初步探讨人工合成多肽MAC-1(以下简称MAC-1)体外和体内抗乙型肝炎病毒作用及机制。方法:1、以转染人HBV全基因组的人肝癌细胞(HepG2.2.15)为体外细胞模型。(1)MAC-1对HepG2.2.15细胞的活性作用,不同浓度MAC-1(10,100,1000,2000,10000μg/ml)作用细胞48h,采用MTT方法检测细胞活性;(2)MAC-1抗HBV活性作用,根据不同组别: