大数据挖掘在图书阅读推荐中的应用研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:zcv_2323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的来临,给整个社会的各个领域都带来了巨大的冲击和挑战,大数据正在影响并改变着我们的生活。在这个信息过载、信息爆炸的时代背景下,如何快速地过滤掉冗余的信息和垃圾资源,准确地找到我们需要的信息资源变得比以前更加困难。所以个性化推荐应运而生,它是一个有效的便捷途径,我们可以从系统给我们推荐的信息中迅速找到自己需要的信息,省去了自己再去搜索的时间。同样的,个性化的图书推荐能够很好地帮助读者从图书馆海量的图书资源中过滤掉大量的自己不感兴趣的图书,快速引导读者准确的获取到自己所需要的高质量的图书资源,节省了读者找书的时间,同时也能提高图书馆藏书的利用率。一般情况下,个性化推荐都由推荐系统产生。在推荐系统中,最关键的就是推荐算法,它决定了推荐效果的好坏。在众多的推荐算法中,应用最为广泛的就是协同过滤算法,它主要包括基于用户的协同过滤算法和基于物品的协同过滤算法。本文将尝试通过对图书借阅数据来挖掘读者评价,并利用协同过滤算法进行个性化图书阅读推荐来探讨将大数据挖掘技术应用到图书阅读推荐中的可行性,主要研究内容为:1、学习和研究大数据的发展和应用的现状以及推荐系统的研究现状,学习了大数据挖掘的分布式框架Apache Hadoop和Apache Mahout。2、深入学习和研究了两种协同过滤算法,详细分析了两种算法的原理和步骤,并对比分析了两种算法的优缺点和存在的问题。3、利用某大学图书馆管理系统中导出的真实的借阅数据进行实验。利用了K-Means聚类算法,按照读者借阅时间长短进行聚类计算,作为读者对所借图书的评分。4、结合Apache Mahout分别编程实现了两种协同过滤算法,并利用图书借阅数据进行实验,产生推荐结果,并在Hadoop平台上对基于物品的协同过滤推荐算法进行了分布式的实现。
其他文献
<正>2010年11月15日,中共中央宣传部、中共中央对外宣传办公室、国家广播电影电视总局、新闻出版总署、中华全国新闻工作者协会联合下发《关于深入开展"杜绝虚假报道增强社会
目的研究食品包装用复合膜材质的分析方法。方法样品截面经包埋抛光后,采用扫描电镜-能谱仪(scanningelectronmicroscope-energydispersivespectrometer,SEM-EDS)对样品层数
根据2014年11月在中东大西洋塞内加尔沿岸底拖网渔船进行的渔业资源调查,并结合遥感获取的海洋环境数据,应用相对重要性指数、生物多样性指数和多元统计分析等方法对中东大西
<正>1.原料准备。主要原料为白菜,一般采用每棵重1~1.5千克的白菜。每100千克白菜配辅助原料为:鲜萝卜50千克,葱2千克,大蒜1.25千克,干辣椒1千克,生姜1千克,虾油2千克,精盐2.5
资金是企业开展生产、经营的基本要素,资金缺乏、融资能力差、融资渠道狭窄成为阻碍中小企业发展的一大瓶颈,越来越多的管理者开始关注供应链运营过程中的资金约束问题。资金
<正>一、原料配方大白菜50公斤,盐250克,生姜50克,大蒜1公斤,白梨500克,辣椒粉250克,香菜籽、白糖、味精适量。二、制作方法1.选棵大、心实的大白菜,去老帮,削去青叶,去根,用
期刊
随着网络社交工具的普及,越来越多的高校图书馆利用微博展示和提升其网络形象,但对微博到底能呈现出何种形象却少有研究。本文采用内容分析方法,以较为具有代表意义的厦门大
文章认为,在共时层面上,歧义双宾句式实现语义分化的策略呈现出南、北方言的差异性:北方方言和普通话大多用“V+给”结构表示“给予”义,而用“V+了”表示“取得”义;南方方
通过对四川盆地东南缘8件不同层位的磷灰石样品裂变径迹的分析,获得了该区中新生代构造隆升的时限,并分析了其构造和油气地质意义。磷灰石裂变径迹分布形态总体具有单峰特征,
1.配料比例:白菜50公斤,青萝卜5公斤,胡萝卜5公斤,盐4公斤,香菜2.5公斤,酱油2.5公斤,味精0.2公斤,辣椒粉1.5公斤。$$ 2.加工方法:选择满心的大白菜,去根及老叶,洗净放到缸内?
报纸