基于Hadoop的酒店推荐系统

来源 :南昌大学 | 被引量 : 0次 | 上传用户:liuyanan508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术日新月异的今天,超载问题日益突出,推荐系统则是这一问题的最优解决方案,能够基于用户的兴趣,在海量信息中迅速匹配到他们所需要的内容。而在现实中,因为物品与物品、人物与人物之间拥有大量的相关数据,基于单机的推荐系统因为性能有限,已难以针对海量的信息数据进行推荐计算。针对推荐系统的可扩展性,已出现了多个解决方案,它们都基于分布式开源软件架构Apache Hadoop。本文研究了HDFS分布式架构,并对MapReduce编程模型做了探讨,再与近年广泛应用的协同过滤推荐算法相结合,提出了一些基于MapReduce编程理论的分布式并行算法,而Mahout推荐算法框架正是对推荐算法MapReduce编程的封装。具体内容如下:(1)、本文研究了HDFS分布式架构,并对MapReduce编程模型做了探讨,再与近年广泛应用的协同过滤推荐算法和系统相结合。以MapReduce并行化编程作为该系统主要编程方式的,分解该算法的复杂任务,使之成为多个MapReduce作业小任务,为了使分布式并行处理能在Hadoop框架上得以实现,利用不同类型的协同过滤推荐算法做了验证,从而证实了,该设计在集群中具有较强的可扩展性,并行性也较好。(2)、研究了该系统的数据源结构,该系统推荐模块采用了旅馆业治安信息系统数据,然后深入分析该数据的内部结构,挖掘提取出有价值的数据。(3)、研究了多种开源框架的使用,包括Hadoop、storm、Sqoop、Mahout等开源框架或算法框架。由于采用MapReduce去实现酒店协同过滤算法,更有利于解释该推荐算法的精华,所以本文重点研究了如何采用MapReduce去实现酒店推荐算法。而在系统实现层面,采用了Mahout开源推荐算法框架,该框架是对MapReduce实现协同过滤推荐算法的封装,更加有利于开发。(4)、研究了基本信息系统的实现。由于推荐模块的最终结果需要呈现给顾客,所以这里需要简单研究下如何使用Java开源社区的框架去如何开发Web应用;而酒店推荐模块和Web系统是独立开来的。本文重点是酒店推荐模块。
其他文献
为提升LED芯片的光提取效率和电流扩展能力,设计了双金属层环形叉指结构ITO/DBR电极的大功率倒装LED芯片,并对分布式布拉格反射镜(DBR)薄膜和环形叉指电极结构进行了仿真优化
本文将详细介绍Deep ID网络人脸检测与识别算法研究,包括Deep ID方法的网络结构、计算过程、数据集等内容,在此基础上介绍了联合贝叶斯模型。并通过对比实验,给出了Deep ID网
善意取得肇源于"应以手护手"原则,借鉴了罗马法上的时效取得制度,在物权法中发挥着不容小觑的作用。随着商品经济的发展,域外愈多的立法成例对盗赃物适用善意取得给予了肯定
GaN材料作为一种宽禁带半导体材料、相比于其他半导体材料具有许多突出的特点比如高电子漂移饱和速度、良好的导热性能、化学稳定性高,这是如此得到了快速的发展和被广泛应用
学位
为提升公路景观敏感度评价的完整性和准确性,文章以渝武高速公路北碚段其中一段为实例进行研究,并根据现代公路特点和要求,把公路景观敏感度评价指标分为景观生态指标、景观
水稻(Oryza sativa L.)是最重要的粮食作物之一,全球近一半的人口将稻米作为主食,但它同时也是重金属镉(Cd)的主要暴露源。中国水稻镉污染区主要分布在长江三角洲、华南和东北部
粘胶纤维是一种可再生纤维素,其在透气性、吸湿性、染色性、可纺性等方面极具优势,故在服装行业得到了广泛应用。在粘胶纤维生产过程中,由于使用二硫化碳为溶剂,导致大量含硫
据公安部网站消息,由公安部起草的《旅馆业治安管理条例(征求意见稿)》日前开始征求意见。征求意见稿中规定,旅馆及其工作人员传播、出售、提供、泄露、删改旅客住宿信息和旅馆视
作为纺织之乡,南通的纺织企业遍地开花,生产的纱线除一些特殊品种外,普通纱线存在的质量差异已渐渐缩小。在质量相差无几的纱线面前,销售人员的销售与开拓能力显得尤为重要。
目的:研究行为管理技术在儿童口腔临床治疗中是否有作用。方法:按治疗先后顺序,在口腔门诊随机选择3-12岁的牙病患者236人,随机分为两组。试验组118例在治疗中运用行为管理,