融合特征权重与矩阵填充的可解释推荐算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:lwfriendly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的快速发展,人们已经步入信息化社会,每天需要从海量数据中筛选出自己最关注的信息,推荐系统的存在就显得尤为必要。推荐系统作为解决“信息过载”的有效技术之一,一直是学者们研究的重点。传统推荐算法已经逐渐趋于成熟,广泛应用于各大网站,如:淘宝、京东、唯品会等。但是传统的推荐算法对用户来说具有黑盒的不可解释性,用户并不了解推荐的原因而只能被动的接受推荐。因此,推荐系统的可解释性研究逐渐被学者们广泛关注。可解释推荐可以帮助用户做出明智的选择,提高用户对系统的信任,实现用户与系统的双赢。目前,推荐系统大都通过挖掘历史评分与评论中的有效信息进行推荐,但为用户和商品间相关性建模时忽略了用户和商品不同特征属性的不同重要程度,以及存在评分矩阵数据稀疏等问题。基于以上分析,本文提出融合特征权重和矩阵填充的可解释推荐算法,在提升推荐精度的同时,提供定量的特征级别解释。本文的主要研究工作如下:(1)针对目前推荐算法在为用户商品间相关性建模时未充分考虑用户特征和商品属性重要性的问题,本文提出了基于特征权重的推荐算法。该算法根据在评论中特征或属性出现的频次及其对应的情感程度确定用户和商品的表征,同时采用情感词典和TF-IDF的算法思想确定特征和属性的重要程度,并将特征属性权重加入到相关性建模中。(2)针对评分矩阵的数据稀疏性问题,本文进一步提出融合矩阵填充和贝叶斯排序的稀疏性缓解算法。该算法根据用户特征权重和商品属性权重对评分矩阵中的缺失项进行填充,然后采用潜在因子模型学习用户商品的潜在向量,结合评论中挖掘的表征向量,最后引入贝叶斯个性化排序算法约束用户与不同商品间的偏序关系。(3)针对传统算法的黑盒问题,本文提出特征级别的定量解释。本文通过TF-IDF算法确定特征属性的权重,综合考虑用户特征权重和商品属性权重,将综合权重最大的三个特征作为解释,并给出可视化推荐理由。将本文提出的算法在Amazon和Yelp的四个真实数据集上进行实验,并与目前具有代表性的几种模型进行比较,实验结果表明,本文提出的算法在提供解释的同时,均方根误差相比最优的RMG平均下降了2.5%。
其他文献
行人搜索是一项需要同时解决行人检测和行人重识别问题的计算机视觉任务。随着深度学习的兴起,行人搜索研究获得了快速的发展。然而现有的行人搜索技术仍然面临着很多挑战,诸如行人搜索中的身体部位未对齐问题。行人搜索中的身体部位未对齐问题是由不同的视角、不同的尺度、多变的姿势、遮挡以及身体部位缺失引起的。基于水平分割的对齐方法对人体的划分过于粗糙,无法使网络学习到不同身体部位的最佳局部细粒度特征。现有的基于关
学位
植物品种分类是植物资源调查、作物育种等研究的基础。作为植物最重要的器官之一,叶片一直是识别不同植物的关键依据。近年来基于叶片图像的植物分类研究得到了广泛关注,并取得了显著成果。但是现有研究多关注于不同物种的区分,缺少能够准确区分同一个物种下不同品种叶片的分类方法。与物种间的叶片分类相比,品种间叶片分类是一种更细粒度的分类问题,其面临着不同品种间叶片相似度较高的挑战。因此实现品种间叶片分类的关键在于
学位
网约车打车已成为人们生活出行的重要方式之一,如何合理地将乘客发起的订单和现有的车辆进行匹配以及如何给乘客进行定价是网约车打车服务中的关键问题。在网约车打车环境中,乘客会提交出行订单请求,包括乘客愿意为出行服务支付的最大价格(即订单对该乘客的价值)。网约车平台将乘客提交的订单与车辆进行匹配,并对获得匹配的订单进行定价,最大化平台和乘客的社会福利。在此环境下,乘客为了提高自身的收益可能会虚假地提交自身
学位
车牌检测是智慧城市、智能交通系统中的一项不可或缺的主要支撑技术,已经逐步应用于停车场出入口、天网监控、高速公路收费管理站等场景。尽管很多科学工作重点都集中从视频序列中检测车牌,但在设计一个跟踪方案来进一步定位车牌检测中漏检的车牌以提高检测率方面却鲜有工作。在现有的研究基础上,面向监控视频的车牌检测与跟踪存在以下三个问题。第一,现有车牌相关研究主要集中在不同条件下的静态图像上,缺乏面向监控视频的车牌
学位
为廓清数字化转型能否优化企业内部收入分配格局、夯实共同富裕经济根基,本文选取2007—2020年A股上市公司为样本,研究了数字化转型对企业劳动收入份额的影响。研究结果表明,数字化转型显著提升了企业劳动收入份额,在企业内实现了“分好蛋糕”的功能。其作用机制在于,随着数字化转型程度提高,企业融资约束缓解、创新激励增加,两者共同促进企业劳动收入份额提升。基于企业特征的异质性研究显示,数字化转型对信息透明
期刊
水铁联运模式下的铁路站场资源调度是多联式港口资源调度中极为重要的部分。水铁联运模式下的铁路站场调度不合理,极易导致港口资源利用率低下,港口作业成本增加,严重阻碍港口向智能化、现代化方向发展。在水铁联运模式下的铁路站场调度系统中,如何根据作业任务合理的对设备资源进行分配,提高机械的装卸效率、降低装卸作业成本,已成为建设现代化港口进程中亟待解决的问题。鉴于以上问题,本文研究内容如下:(1)建立了基于D
学位
随着数字经济的蓬勃发展,数字技术渗透到企业成长的各个环节,越来越多的企业试图通过数字化转型提升自身的价值创造能力。数字化转型改变了企业价值创造的方式,为利益相关者实现价值共创提供了新途径。本文基于利益相关者理论和价值共创理论,探讨数字化转型赋能各利益相关者价值共创的过程,构建“资源—连接—互动—绩效与反馈”的数字化转型下利益相关者价值共创的理论框架。在此基础上,提出企业数字化转型下多元主体参与的价
期刊
文章以2005—2020年我国25个工业行业为样本,构建基于行业技术相似度矩阵的空间计量模型,考察数字化转型对工业技术升级的具体影响及其溢出效应。研究发现:我国工业行业间存在显著的技术溢出效应,其水平随着时间推移逐渐趋缓;数字化转型与行业技术升级均存在显著的空间依赖性,主要表现为HH型和LL型的空间正相关性;数字化转型有利于推动工业技术升级,数字化转型对工业技术升级的推动作用具有显著的行业溢出效应
期刊
文本在人类的发展过程中起着举足轻重的作用,随着深度学习的发展,越来越多的学者加入到研究文本检测与识别的行列中。自然场景下的中文识别也逐渐应用到各行各业,但是它不仅受到外界因素和拍照角度、光线等的影响,也会因为自身复杂的结构以及形近字的问题导致检测和识别难度大大提升。目前的深度学习方法虽然在识别英文方面有很高的准确率,但是识别中文的能力仍旧比较弱。因此,本文以前人研究的相关技术为基础,针对中文文本的
学位
随着生物识别技术的飞速发展,基于生物特征的身份认证技术在日常生活中发挥着越来越重要的作用。其中,人脸特征采集方便,且具有稳定性、可靠性和唯一性,因此基于人脸特征的生物认证技术在安保和支付等领域得到了广泛的应用。但由于人脸是唯一且不可撤销的生物特征,一旦人脸模板泄露,用户将永远无法继续使用与人脸识别相关的服务,因此保证人脸模板的安全性对基于人脸特征的生物认证技术至关重要。然而由于人脸图像存在高类内差
学位