基于因子分解机制的跨域推荐算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zhairui15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去十几年的时间里,电子商务、社交网络等都在飞速地发展。与此同时,大数据时代随着不断增长的数据量而来临,信息过载这一问题也由此产生。推荐系统逐渐成为了有效解决信息过载问题的一种方案。传统的单一领域推荐系统由于难以有效解决数据稀梳问题以及冷启动问题,导致准确率较低,算法难以扩展。随着各大电子商务系统内领域的增多,不同领域内的用户信息可以实现互补,这为跨域推荐带来了新的契机。因子分解机制(Factorization Machine,FM)是解决高维数据的特征组合问题的有效途径,同时减少数据的稀疏性带来的影响,并且具有较高的预测精度。它可以在线性时间内完成预测,因此在推荐系统和广告点击率预测中成为了研究的重点。为了提高跨域推荐算法的准确率,并解决冷启动和数据稀梳问题,本文提出了基于因子分解机制的跨域推荐算法,主要工作如下:(1)针对在跨域推荐中应用因子分解机制时,如何整合各个领域之间的相关性的问题,本文研究了用户在目标域和辅助域中评分的皮尔逊相关系数,定义为领域相关度。将领域相关度与用户在领域内的平均分的乘积结果作为因子分解机制的特征向量的扩展部分,以此获得了二阶特征之间的约束,提高了因子分解机制的准确率。(2)出于对用户的兴趣、行为等因素的考虑,本文基于大量带有时间因素的用户评分数据,分析了用户行为的动态性在推荐算法中的作用。针对时间因素对用户行为变化的影响问题,通过拟合艾宾浩斯遗忘曲线得到的时间权重函数,探讨并提出了具有时间权重的跨域推荐算法。(3)在不包含用户评分时间戳的短时间跨度以及包含用户评分时间戳的较大时间跨度亚马逊用户评分数据集上,将本文所提出的算法进行试验后与相关的对比算法进行的实验作比较。实验结果表明,与单一领域推荐应用FM和应用了FM的跨域推荐方法相比,本文提出的方法有较低的MAE、RMSE值,并且可以一定程度上减轻用户的冷启动问题。
其他文献
作为人们休闲娱乐和学习提升的重要选择,有声读物平台在信息技术推动下得到快速发展,但也形成激烈的竞争市场。在此环境下,如何持续满足用户需求并获得竞争优势,是有声读物平台亟待解决的现实问题。本文根据伍德鲁夫的用户价值理论,将上述问题转化为有声读物平台用户价值实现问题,并以有声读物平台主流用户(青年用户)为对象,综合运用用户价值理论和阶梯理论,在实证分析的基础上,对我国有声读物平台的青年用户价值展开研究
投票是人们政治和生活中的重要组成部分.随着信息理论的快速发展,基于互联网的电子投票方案得到了广泛的应用.实际投票方案需要满足选民身份的匿名性,合法性以及投票信息的保密性.在目前的电子投票方案中,上述安全性需求大都由基于数学困难问题的经典密码学理论来保证.然而由于量子计算为部分数学困难问题的解决提供了高效的算法,这也为现有的电子投票方案带来了潜在的安全隐患.为了克服这一点,基于量子本身物理特性的量子
进入21世纪第二个十年,数字经济快速发展,数据已经日益成为经济发展的重要驱动力,数字化转型是企业未来生存发展的必然选择。商业银行也正在通过数字化转型改变传统的经营理念,开始逐渐树立“用数据说话”的数据文化,利用数据资源创新管理,支持精细化管理、差异化服务和实时风险分析,以实现数据资产价值的进一步提升。同时,金融监管机构也对银行数据治理提出了要求。2018年中国银保监会发布《银行业金融机构数据治理指
“互联网+”能够破除时间与空间之间的界限,将教学活动与互联网紧密结合,使知识不再被权威垄断,教育也从封闭走向开放。面对“互联网+”的普及,思想政治课教育正在经历一次重大变革。就当下局势来看,虽然国家层面上正致力推广“互联网+”,但一线课堂教学的方式依然如旧,“互联网+”的优势并未被完全发掘和利用。思想政治课时政教育作为能够帮助学生更好理解思想政治课科学性和思想性的重要形式,受制于教科书内容和传统时
电力电子技术的发展使电动机广泛用于能量转换的核心的部件,永磁同步电机(Permanent magnet synchronous motors,PMSM)因其传递效率和高能量密度在各类电机应用中脱颖而出。本文以电机在实际工程中的运行精确度和稳定性问题作为研究重点,利用非线性控制理论研究三相PWM变流器的不规则现象,结合反馈线性化控制理论,研究PMSM的非线性动力行为及其控制策略。本文选择输入-输出反
IPO抑价常被作为IPO定价效率高低的判定标准,而我国INO抑价较高的现象一直存在。询价制下,我国新股定价趋于市场化,行政干预逐渐减少,IPO抑价也随之降低,IPO制度改革取得了实
本文从政府竞争角度出发,研究财政分权情况下地方政府博弈行为对政府债务增长的影响。首先通过对同级政府之间、中央政府和地方政府的博弈行为进行分析,然后将层及政府之间纳入同一个分析框架中,从单一政府的情况出发,进行扩展形成一个中央政府、两个地方政府的模型中,从中考察财政分权、政府竞争对地方政府基础设施建设投资的影响,进而分析地方政府债务扩张的机制,由于政府竞争的存在,扩大地方基础建设投资能够为地方政府带
随着物联网技术的快速发展,物联网设备越来越多融入人们的日常生活中。然而物联网在为人们的生活带来便利的同时,也给人们带来了许多隐私困扰,比如隐私信息窃取和隐私信息滥用等。这些物联网隐私问题产生的根本原因是用户在物联网隐私生态中处于弱势地位。一般来说隐私政策是厂商制定的且必须同意,否则无法使用该产品。普通用户在隐私政策的制定、修改和同意过程中没有话语权,隐私声明晦涩、难懂、不明显,进一步导致用户不了解
大豆是我国乃至世界的主要农作物之一,也是当前我国重要的、具有战略意义的作物之一。因其可粮油饲兼用,具备优秀的应用价值。目前,我国自行种植和生产的大豆远不能够充分满足国内的需要。对大豆的大量需求推动了对优良大豆品种的选育工作,从而提升大豆综合品质,为提升国内大豆产量提供帮助。大豆豆荚形态是用于选育高品质大豆的重要参考指标之一。因此,准确分类豆荚形态有着相当高的重要性。传统方法多采用人工方式进行分类,
近年来,随着社会老龄化人口日益增加,其健康问题越来越突出,老年人医疗卫生工作受到广泛的关注。并且面对传统医学的信息采集格式不统一、无法实时查询分析等工作效率低下的问题,人们迫切地希望通过发展迅速的信息技术满足当前的需求,并实现有效地使用健康资源。健康数据管理系统结合计算机领域的相关技术,可以实现从健康数据的录入,到个人健康记录的生成,再结合专业的医护人员和系统的评估算法共同进行健康评估的健康管理过