基于大数据挖掘技术的高校个性化图书推荐系统研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:r57014848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和人类生产生活深度融合、互联网快速普及,全球数据呈现爆发增长、信息爆炸问题日趋严重,以个性化推荐为代表的大数据挖掘技术正在成为解决信息过载的重要工具。图书馆是高校中的“知识海洋”,为全校师生提供图书借阅、文献检索及科研支持等服务。在传统的借阅方式中,师生产生图书借阅行为源于学习需求及兴趣爱好,图书以一种被动的方式被借阅。在这种借阅形式中,读者会面对以下两个问题:一是在数以百万计(国内部分高校图书馆藏书已达千万级)的图书面前难以快速找到符合需求的书籍;二是不能较好地发现潜在兴趣爱好而进行拓展性阅读。同时,对于图书馆而言,由于被动式借阅方式使得许多图书借阅率低、空置率高,图书资源得不到充分利用。对于传统的图书管理系统而言,由于功能设定的缺失和所能处理数据量级的限制,上述三个问题难以得到良好的解决。据此,本文通过分析研究场景需求、结合业界现有解决方案、综合考虑场景可用数据提出混合推荐算法,并设计了基于Spark大数据处理引擎搭建个性化图书推荐系统方案,旨在解决现有问题,为提高校师生借阅质量、提升图书资源利用率提供思路。本文的研究内容及主要贡献如下:(1)设计了一种基于时间上下文信息优化的协同过滤算法。算法就高校图书馆缺失图书评分问题,提出一种基于读者“借阅”、“续借”、“预约”及“荐购”行为建立的兴趣度评分模型。在此基础上,针对传统协同过滤算法存在捕捉用户兴趣变迁能力不佳、推荐准确率不高问题,从时间角度利用图书分类号信息对其进行优化。经过验证,本文提出的优化算法在推荐10本图书的情况下,推荐准确率比未经优化的协同过滤提高了51.3%。(2)设计了一套面向研究场景的混合推荐算法方案。方案给出了一种基于图书摘要等信息的文本语义推荐思路,并对该思路的实现进行详细地阐述与探讨。然后通过实验探讨了该方法在推荐准确率及覆盖率上的表现。紧接着方案就文本语义推荐准确率较低、覆盖率较高与协同过滤类算法准确率较高、覆盖率较低特点给出了一套混合推荐方案。经实验证明,在推荐10本图书的情况下,文章提出的混合推荐算法比优化后的协同过滤推荐算法准确率提高了11%、覆盖率提升了13%。(3)设计了一套基于Spark平台的推荐系统。文章首先对系统的业务和功能需求进行分析,进而根据分析结果给出了基于Spark大数据处理引擎的推荐系统架构,并对其分布式平台搭建、数据处理及推荐计算模型进行深入研究。
其他文献
随着我国老年人口的不断增长,国内老龄化的问题越来越突出。而且随着年龄的增加老年人各种生理指标功能出现下降,感官和姿体协调能力出现衰退,增大了在日常生活中,如跌倒、滑倒等意外事故发生的风险。据相关统计显示,绊倒是导致老年人意外伤亡的主要因素之一,跌倒不仅会导致老年人的身体出现损伤和残疾,而且还会造成老年人在心理上出现抑郁、焦虑、跌倒恐惧等问题,因此对老年人跌倒方面的相关研究具有重要的意义。本实验设计
我国是世界上人口最多的国家,社会老龄化的问题日益严重。统计显示,与绊倒相关的跌倒是导致65岁以上的老年人因伤害而致死的主要因素之一。因此,对于绊倒问题的研究是十分重要的。本项研究的主要目的是探索绊脚后平衡恢复反应机制。实验采用随机征集受试者的形式,招募了133名受试者参与本实验。VICON运动捕捉系统收集受试者在实验过程中的绊脚数据,根据每位受试者在绊脚后的恢复情况将其分为恢复成功组或恢复失败组。
民间艺术是从乡土社会中萌发、由劳动者创造的并且在乡野之间成长起来的艺术。在当代移民浪潮的带动下,民间艺术的跨时空流动变得异常地活跃,其流动的路径通常是“乡村—都市”、“小城镇—大都市”。深圳作为一座典型的移民城市,其文化的流动性极强,改革开放以后,大量的外来民间艺术涌入,在历史上形成三个阶段:试水创业与分布散落期、园区展演与抱团发展期、个体创新与公共服务期,这些分期之间的过渡和衔接存在着一定的模糊
在我国经济和社会快速发展的今天,志愿者在社会治理方面发挥着愈发重要的作用。志愿服务是社会文明的催化剂,在消解社会矛盾的同时,构筑了社会文明之网,成为了社会治理中的关键一环。在某种情境下,志愿者与非营利组织属于具有共同价值追求的伙伴关系。残障群体是社会的重要组成部分,助残非营利组织与助残志愿者一起成为了残障群体社会支持的重要来源。助残非营利组织致力于解决残疾人的需求问题;而志愿者为助残事业贡献宝贵的
20世纪80年代,实验戏剧在中国异军突起。改革开放后三十余年的的文化开放氛围中,深圳实验戏剧呈现出了深圳这座城市特有的文化与艺术特征。作为城市发展的文化符号,都市戏剧成为了城市物质与精神文明发展的见证者。本项研究以深圳的实验戏剧为对象,结合具体案例分析,探究实验戏剧在深圳的发展状况以及艺术特征,最终呈现出实验戏剧背后的深圳文化发展脉络。论文共分为五个部分:序论部分介绍选题背景及意义,针对实验戏剧、
在经济全球化进程不断向前推进和高新技术快速发展的背景下,无论是发达国家还是发展中国家都在积极推动产业结构升级,引导产业结构从劳动密集型和资本密集型转向知识密集型和技术密集型。与发达国家相比,中国产业结构升级速度缓慢,仍面临高新技术产业发展后续不足、三次产业内部结构不合理等问题,这凸显了中国加快产业结构转型升级的必要性和紧迫性。在知识经济时代,人才又是影响产业结构升级的核心要素。所以在全球范围内,各
本论文以辛亥革命前后中国社会思潮与长三角地区戏剧市场的关系为研究对象,旨在以从艺术史的角度,探索近代历史转折期中国社会思潮与戏剧的互动关系。在结构上,本论文共分为五个部分。第一个部分是绪论;第二个部分着重探讨辛亥革命前后以国粹主义、无政府主义与革命主义为代表的三种主要中国社会思潮的生成、传播与演进情况;第三个部分以京剧、昆曲两大剧种的演出市场为例,探讨辛亥前后长三角地区的戏剧市场总体状况;第四个部
近年来随着我国各地高校扩招政策的实施,在校大学生日益增多。宿舍作为他们主要生活和学习的场所之一,其健康环境条件需要特别重视。然而目前大量的既有宿舍存在许多影响大学生身心健康的环境问题,比如室内空气环境恶劣、居住体验感差、隔音效果不好和人员交互关系淡薄等。相关学者对这种现状改善的研究主要集中在建筑本身的构造和性能上即所谓的绿色建筑,或是独立分析宿舍社区主体交互关系的状况,并未从宏观及微观各个角度综合
随着全球工业信息化与智能化的不断发展,智能机器设备逐渐替代人工生产,使得机械设备的可靠性和服役寿命面临巨大挑战,促使设备故障诊断与健康管理技术面临更高需求。其中,以摩擦副磨损的直接产物—磨粒作为研究对象的铁谱分析技术可获取宏观磨损量和微观磨损机理信息,为机械设备磨损状态分析提供重要依据,已经成为重大机械设备健康状态监测的重要手段。本文针对铁谱图像分割和磨粒识别方法存在周期性长、效率低等问题,提出基
随着大数据与人工智能等新技术的发展,将大数据挖掘技术与教育行业相结合以提高学校智慧管理水平的方法日益受到关注与重视。目前,各大高校校园建设已经从数字化校园建设时代步入智慧校园建设时代。高校开始逐步地对已建设的校园一卡通系统、教务系统等校园应用系统进行整合,并对所采集的各大应用系统的历史数据进行挖掘分析,从中提取隐藏的数据价值,以进一步提升学校的服务管理水平。基于此背景,本文以来自各大应用系统的校园