基于隐语义模型的个性化推荐系统研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:tklyzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的迅猛发展,使人们获取信息的方式发生着前所未有的改变,只要具备相应的条件就可以较方便从互联网上面获取丰富的资源信息,其给用户带来便捷的同时也面临着新的问题,那就是“信息过载”问题出现。然而推荐系统的出现可以有效解决此类问题,它能够根据用户的历史行为数据主动为其推荐所偏好的数据。在推荐系统中隐语义模型是一个较年轻的推荐算法,目前其在很多领域得到了应用,但是该模型在实际的应用中仍然还有一些缺陷值得我们去深入研究。首先,传统隐语义模型推荐算法存在冷启动问题以及面对用户历史评分数据过于稀疏导致了推荐精度下降的问题。其次,随着用户和物品规模不断的增长,推荐系统需要处理的数据量变得越来越大,使得传统隐语义模型推荐算法面临着扩展性较差的问题。因为该模型推荐算法中的参数要经过不断迭代与更新,所以在时间消耗以及计算量方面都比较大。为了解决传统隐语义模型推荐算法存在的问题,本文在该模型的基础上做了相应的改进,有效解决冷启动以及数据稀疏性所带来预测准确度下降的问题。为了使改进后隐语义模型推荐算法有较好的扩展性,本文通过分布式环境使推荐算法并行化来解决此问题。本文主要研究工作如下:(1)针对传统隐语义模型存在冷启动以及在面对数据稀疏性所带来预测精度下降的问题,因此本文对该模型进行了相应的改进。通过将用户的自身特征属性信息融合到传统的模型中去,当用户评分数据存在稀疏或者极端稀疏时,可以利用用户的自身特征属性来获取邻居用户的评分数据,然后基于邻居用户的评分数据来为该用户做出相应的推荐结果。最后实验结果验证了改进后的算法有效解决数据稀疏性所带来预测准确性下降的问题。(2)为了使改进后隐语义模型推荐算法在处理大量数据时有着较好的扩展性,本文提出一种在spark分布式环境中使推荐算法并行化的解决方案。为了验证改进后推荐算法在分布式环境中面对大量数据计算时是否有较好的扩展性,进而在不同大小的MovieLens数据集上面实验,实验结果验证了改进后推荐算法在spark分布式环境运算中有着不错的扩展性。(3)基于本文改进后的隐语义模型为核心,然后设计一个基于spark大数据平台的原型推荐系统,最后在该原型系统的前端界面完成了相关的功能测试。
其他文献
本文通过对普通带式压滤机的分析研究,针对矿浆脱水性能要求高的特点,研究设计了一种新型选矿用高压带式压滤机。其过滤速度和脱水工作压力都是普通带式压滤机的2~3倍。该设备主要
对电网规划中200kV变电所布点方案设计问题,采用混合整数规划方法,找出在技术上可行的经济效益最好的方案,并进行了方案经济效果的敏感性分析,说明对较大工程项目建设方案进行可行性研
微课是一种新型教学模式,它是在信息技术与学科整合过程中产生的。就初中化学教学而言,微课的有效应用意义重大,既能促进学生创新精神、实践能力的培养,又能增强初中化学教学
期刊
为提高模锻成形过程设计的计算效率,提出了一种基于正交设计和数值模拟相结合的优化设计方法,该方法将优化过程与有限元模拟相分离.将其应用于斗齿锻件模锻优化设计,优化了锻
随着社会经济的不断发展,生态问题越来越受到人们的关注,生态环境建设对于人们的日常工作和生活起着非常重要的作用,这就要求相关园林设计者在进行园林设计时必须以生态环境
“连云港市各级党委在落实主体责任上做了许多工作,但仍存在向下传导力度递减,基层党委责任担当不够的问题。”今年11月,江苏省连云港市委书记杨省世带头,针对基层落实“两个
大学生作为社会主要储备人才,其保持良好的体质健康状态,对于促进社会发展意义重大。体质健康在定义上除身体健康外,还包含精神健康相关内容,即生理、心理和道德3方面内容的健康
目的:探讨血清肿瘤标志物联合检测在肺部良恶性病变诊断中的相关价值。方法:2018年1-12月收治肺部疾病患者60例,其中肺部恶性肿瘤患者30例作为观察组,肺部良性病变患者30例作
本论文由导言、正文和结语三部分组成。导言部分主要介绍论文的选题的背景与意义,论文写作的目的、方法及论证思路和结构设计。正文部分由三章组成。第一章,介绍了意思表示的