融合评分和评论的推荐系统研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:boguiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,推荐系统面临着可扩展性差、数据稀疏性、冷启动、低效率、忽略评论信息等问题。本文针对这些问题提出融合评分和评论的推荐系统,加入语义分析,优化算法,并设计出相应的管理系统。主要工作如下:第一,本文在ALS推荐算法基础上提出一种新的评分模型NALS-WR,并借助Linux集群上的Spark实现NALS-WR算法的并行化,由于其分布式计算框架和云计算环境,NALS-WR具有很强的可扩展性,解决传统的矩阵分解算法的资源分配的瓶颈,提升处理海量数据的速度。在真实的MovieLens数据集上进行实验,结果表明,与传统的最小交叉二乘法ALS推荐算法和奇异值分解(SVD)等推荐算法相比,NALS-WR推荐的准确率和运行效率提高了,数据规模越大,NALS-WR的效率越高。第二,提出融合评分和评论的模型FRRM(Fusion of rating and review model),该模型采用LDA主题模型挖掘潜在主题信息,构建文档—主题分布,进而基于评分数据与文档—主题分布共同构建一种新的预测评分的策略。利用评论文本增强评分预测是本文的另一大亮点,其克服了传统方法丢弃评论文本的做法。在真实的Amazon数据集上进行实验,结果表明,融合评论与评分的模型FRRM克服了原始仅利用评分数据进行评分预测的不足,在评分数据稀疏度高的情况下也可以比同类模型HFT更准确的预测物品评分。第三,设计推荐系统的流程管理平台。利用开源项目Spark-Jobserver管理推荐系统的作业和程序等。利用大数据基础平台Hadoop提供的分布式文件系统存储海量数据。利用Spark分布式计算框架进行数据的分析和挖掘。实现数据分析的抽取,转换和加载过程,实现推荐程序的管理,实现推荐系统的执行以及推荐作业的可视化,并提供可扩展的数据分析程序和流程管理接口。然后部署到云端,使在手机、平板等任何联网的设备上都可实现流程管理,达到对推荐系统的控制更加灵活的目的。
其他文献
面向特征的领域分析是软件产品线实现软件复用的重要方法,但是随着软件规模和复杂度不断提升,领域可变性在不断增加,导致领域特征模型变得越来越复杂,因此复杂性管理问题成为
近年来在微纳操作领域原子力显微镜(Atomic Force Microscope,AFM)作为基本的操作工具得到广泛应用。AFM不仅可以通过对样品表面扫描得到高分辨率成像,还可以对纳米级材料进
保险业与新型城镇化建设之间存在彼此联系、相互影响的关系,目前我国正有序推进新型城镇化建设的顶层设计,保险作为“经济助推器”和“社会稳定器”,能在推进城镇化过程中发
农村土地流转的背景下,土地由原来的分散经营和耕种逐步变为集中、规模化经营;土地的耕种主体由原先的许多小户农民变为少量的种植大户和农村经营合作社;单个耕种主体对化肥的需求量由小变大;单个种植大户对化肥的个性化需求更加突出。市场环境的变化给公司带来了机遇,如何应对市场的这种变化,进而增加公司的营业收入和改善营业利润,是公司面临的课题。商业模式的本质内容是为了赚取利润而经营商业的方法,而商业模式创新是通
科学工作流是近年来提出的一种新的应用泛型,通常兼具数据密集和计算密集的特点,常规的计算环境往往很难满足其执行需要,而云计算技术的发展为解决该问题提供了一种理想的选
水损害一直是沥青路面早期损害的常见形式,针对水损害的研究主要围绕液态水和固态水。近年来,工程研究发现干旱和半干旱地区的沥青路面同样存在水损害问题,而有关气态水对沥青路面的破坏作用及其作用机理的研究尚存在不足。因此,研究混合料组成和服役环境两方面因素对路面水气扩散特征影响,对于建立多因素影响的水气扩散模型,揭示气态水对沥青混合料的损伤机理显得尤为重要。本文主要通过改进重量法为基础的扩散试验并进行扩散
在经济全球化背景下,开放的国际市场促使企业逐步“走出去”,以应对日益饱和的国内需求。特别地,“一带一路”倡议为我国企业进一步“走出去”拓展海外市场提供了重大的发展
随着信息化的发展,报表作为一种信息交流的重要方式,是电子政务信息系统的必要组成部分。使用者单位需要一个随需而动的数据填报工具以更快更好地满足本身需求,“分布式应用,
高中思想政治课作为一门德育课程,它承担的不仅仅是学科知识的教育,更重要的是对学生思想品德的规范和引导,即育人性。但是在传统的思想政治课教学中,对于学生情感、态度和价
现代法治国家,无论是大陆法系亦或是英美法系,公权力的行使,均以保护公民权利为宗旨。规范公权力的正当行使并对其进行有效的制约是保护公民权利的基础,也是一种必然趋势。公