融合评论的稀疏线性推荐算法研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:a1390749
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网带来数据量的爆发式增长,阻碍了用户的信息获取效率。推荐系统的目标是帮助用户快速、准确找到其感兴趣的内容,在一定程度上缓解了信息过载,返回包含N个项目列表的Top-N推荐,因其应用广泛而受到关注。针对Top-N推荐,在理论研究和实际应用中,证实了基于学习物品相似度思想的稀疏线性模型相比于其他模型具有更好的性能。本文考察了稀疏线性模型的发展历程,发现其存在以下不足:1)模型中正则化的特征选择稀疏约束效果有待改进;2)仅采用用户-物品评分的单类反馈数据,作为训练样本,带来的数据稀疏性问题;3)模型中物品相似度学习的特征单一。针对上述问题,本文提出一种正则约束方式,并对评论文本信息与模型的融合方法进行深入研究,提出两点改进,在Beer、ML数据集上取得良好效果,最终将上述算法集成于酒类评级推荐系统完成工程实现。具体内容如下:1.提出一种?1/2(10)2正则子方法替代原有模型约束。这种方法改善矩阵W的特征选择效果,使其更易获得稀疏解,从而确保其每一个预测分数都会被表示为少量高相关度的其他相关向量的线性组合,同时,还可防止模型产生过拟合,从而达到算法性能的提升。2.提出一种结合评论的稀疏线性模型。将隐含用户偏好与物品属性的评论文本融入模型:1)重构用户-物品评分矩阵,通过用CNN提取深层次文本特征的因子分解机模型,预测出用户-评分矩阵作为新的训练样本,相比传统基于词袋模型的文本表示方法,提取了更深层的特征,改善了训练样本的稀疏性;2)类比SLIM模型中未评分物品与评分物品间的线性关系,将评论文本词向量矩阵以相同的形式约束模型。3.设计并实现酒类评级个性化推荐系统。利用用户-物品评分数据、用户评论文本数据作为训练样本,集成上述推荐算法于Java Web工程,设计并实现用户登录、酒类推荐和用户评价功能模块,最后完成开发测试及部署。
其他文献
图论作为数学的一个新兴分支,虽然只有200多年的历史,但在各个领域都有着广泛的应用,受到了数学界与其他科学界的重视.本文主要考虑了两个问题:最大度为3的简单图和系列平行
习近平在党的十九大报告提出中国特色社会主义进入了新时代,我们党一定要有新气象新作为,党建思想也必须要跟上步伐。习近平的反腐思想作为全面从严治党里的重要组成部分,在
随着面向对象编程OOP(Object-Oriented Programming)技术的快速发展,面向对象软件OOS(Object-Oriented Software)应运而生,其可靠性和质量问题一直倍受用户的关注。随机测试RT(Random Testing)作为一种常用的软件测试方法,其测试效果并不是十分理想。基于此,T Y Chen等人在改进RT的基础上提出了自适应随机测试ART(Adaptiv
1929年的世界性经济危机,日本侵华以及国内政治经济混乱导致统制经济政策成为当时国民政府首选的经济政策。世界性的经济不景气自然影响到众多产业发展,作为四川省重要生产事业——蚕丝业也受到波及,国际市场的丝价暴跌,使国内市场的丝价和茧价下降,养蚕农民家庭的收入也因此减少。1931年以后,在内外交困中四川蚕丝业跌落低谷。在四川省建设厅成立之后,为了以国家的力量拓展生丝的外销,间接促进农村蚕桑业的复兴,四
机器学习的蓬勃发展使得人工智能的研究迎来了新的春天。分类任务是机器学习最核心的任务之一。贝叶斯网络分类器(Bayesian Network Classifier,简写为BNC)凭借其训练成本低而分类精度高、可解释性强、可直接处理多分类问题等优点一直以来都是分类技术领域的研究热点。朴素贝叶斯(Naive Bayes,NB)是最早提出的BNC,它假设在给定类变量的条件下,特征之间相互独立。然而,在特征
曲面重建是给定未知曲面的部分信息,然后通过重建方法,尽可能的构造一个逼近未知曲面的曲面表达形式。曲面表达与重建在逆向工程、医学、自由曲面设计及影视娱乐等邻域广泛使用,过去几十年,针对以上领域的曲面重建的重建方法的研究已经相对比较成熟了。但是,对于地质约束曲面的重建研究,受限于地质曲面数据的特殊性,地质曲面重建迟迟没有重大的突破。首先,地质曲面重建过程中提供的数据来源于实地勘测数据,数据比较稀疏,而
近年来,金属卤化物钙钛矿(MHPs)由于其优异的光电特性,例如:荧光量子产率高(PLQY高达90%)、色纯度高(半峰宽仅为20 nm)、载流子迁移率高、带隙可调(光谱覆盖整个可见光)等,引起了研究者对钙钛矿电致发光二极管(PeLEDs)的广泛研究。自从2014年首次外量子效率(EQE)为0.1%的金属卤化物PeLEDs问世以来,PeLEDs的EQE得到了极大地改善。目前,基于CsPbBr_3绿光P
2016年6月,我国正式加入《华盛顿协议》,标志我国的工程教育正在向国际标准靠拢。虽然,我国是工程教育大国,工科毕业生总量位于世界第一,但洛桑国际报告指出,我国合格工程师
随着中国经济增速放缓和经济结构转型,企业与企业之间的竞争加剧,如何提高竞争力成为了企业目标的重中之重。在竞争中,实力较差的企业往往处于不利地位,为了改变劣势,通过实
电子文本作为一种重要的信息载体,在人们的生活中发挥着十分重要的作用。但是大部分珍贵的汉字文献资料等都还是以纸质文件存在,急需要通过图像信息转换成易于保存的电子文档,以进一步提高信息利用的便捷性,而人们获取的汉字图像总是存在着各种干扰。本文针对弱光照背景汉字图像照度低、噪声大、汉字结构复杂、低分辨率等特点,给出了一种对弱光照背景下的汉字图像进行图像增强和超分辨率重建联合处理的图像恢复方法。首先,采用