基于深度神经网络融合的协同过滤推荐算法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:qwfyhwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会快速发展,数据量激增,产生数据的速率越来越高,信息的迷航和超载的问题越来越突出。对于大众来说,在海量的数据中发现并且快速筛选出符合自己需求的信息比较困难。推荐算法为适应上述改变应运而生并取得快速发展,现在在理论与应用上也已经取得了一定成果。当前推荐算法的主流还是协同过滤算法,但同时协同过滤算法在处理方法的可扩展性和矩阵的稀疏性方面也有所欠缺。人工智能的迅速崛起,获得了大量研究人员的青睐。人工智能中的深度学习领域更是成为解决问题的首选,通过研究人脑的神经系统衍化成深度神经网络,能够将数据中蕴含的复杂抽象特征编码表示为更高级的数据信息,并在其中获取项目与用户之间非线性且有意义的隐含关系。对于非线性且复杂的高维度数据处理具有高效表现,而且特征提取、构造数据复杂结构具有很高的性能。推荐系统通过深度学习的加入弥补了传统推荐模型存在的缺陷,能够实现较高的推荐质量,因此而受到广泛的关注。为了准确获取潜在特征和提高推荐性能,让用户了解推荐结果的由来,便于做出更明智准确的决策。首先提出一种基于深度神经网络融合的协同过滤推荐算法(Interpretable Collaborative Filtering Algorithm based on Deep Neural Network Fusion,CF-DNNF)。CF-DNNF充分利用数据的隐含属性,通过LSTM网络获取其中的文本属性,通过深度神经网络获取其他潜在特质,达到对数据进行完备的特征提取的目的,将得到的包含属性信息的用户和项目特征矩阵作为DBN深度置信神经网络的初始输入,经过DBN网络输出概率得到预测评分,同时使用特征矩阵与已有评论作为输入。为了验证算法的有效性,分别与PMF、SVD和RBMCF算法在Movie Lens数据集和Amazon product数据集上分别进行预测评分的实验比较,CF-DNNF最好指标RMSE值提高了2.015%,MAE值提高了2.222%,上述结果表明CF-DNNF模型有利于增加预测性能。现代大量的推荐算法试图利用潜在特征来表示用户和条目,有黑匣子来描述深度神经网络内部比较贴切,这可能导致推荐系统缺乏透明度,造成结果不容易预测,而且会影响对算法模型的进一步理解调试。当涉及到电子商务网站时,这种透明问题可能会变得很严重,因为潜在的功能不容易被标记出来。为了在推荐系统与其用户之间建立信任,用解释来补充推荐变得很重要,这样用户就可以理解为什么推荐了某个特定的项目,更信任推荐的结果。基于以上分析,本课题在CF-DNNF基础上提出了可解释性的基于深度神经网络融合的协同过滤推荐算法(Interpretable Collaborative Filtering Algorithm based on Deep Neural Network Fusion,ICF-DNNF),在获得特征矩阵后,将特征及已知评论作为Seq2Seq模型的输入,通过Seq2Seq模型的第一部分Encoder,第二部分Decoder,输出对应预测评分的评论作为解释,在Amazon product数据集上验证性能,与PMF、SVD、RBM-CF算法相比,指标tf-idf是最高的,优于这三种算法。
其他文献
《普通高中语文课程标准(2017年版)》的颁布,以核心素养为本,拉开了语文课程深层次改革的序幕,作为普通高中写作教学举足轻重的一类课型,作文讲评课由于在教学实践中长期面临“高耗低效”的问题,而被推到了改革的前端。普通高中阶段,如何提高作文讲评课的教学效率,解决学生的部分写作问题,提升学生的作文水平,值得进一步深入探索和研究。本文综合问卷调查、个案跟踪、典型作文分析来探讨并梳理目前作文讲评课存在的主
异丁烷-丙烯共氧化是生产环氧丙烷的绿色主流工艺之一。异丁烷-丙烯共氧化工艺副产大量含有叔丁基过氧化氢、异丁酸、异丁酸酯、丙酮等过氧化杂质的叔丁醇。这些杂质的存在不仅影响叔丁醇的质量,而且对叔丁醇的储存、运输和使用带来隐患。为此,本论文制备了一系列Pd基催化剂并详细考察了叔丁基过氧化氢、异丁酸及其酯催化加氢的反应性能,以期建立叔丁醇加氢精制的反应工艺。主要的结果和结论如下:(1)优化了Pd/δ-Al
近年来,电力批发市场和零售市场的逐步放开、可再生能源装机大规模增长以及电网智能化程度的不断提高,对传统电力负荷特性分析方法带来了很大挑战。这种方法仅考虑电力用户的分时用电量、用电峰谷差等需求侧物理指标,无法适应新环境的要求。创新电力负荷分析方法,不仅关系到售电公司等电力企业的业务发展,而且关系到我国电力市场的健康可持续发展以及电力市场化改革的整体推进。本文提出了电力负荷特性分析新方法,该方法引入了
节能减排是当今世界发展的一种必然趋势,而装载机的节能减排技术一直是工程机械领域研究的焦点。据统计,中国平均每年售出12.3万台装载机,制动能量如果不能进行有效回收,将造
城市小汽车数量的日渐增长导致交通出行需求逐渐超过了道路系统所能提供的供给总量,因而引发了愈加频繁的交通拥堵以及安全问题,造成时间以及经济上的损失,人们愈发迫切地需求一种新技术来解决这一城市病。随着人工智能技术更新迭代,实现无人驾驶已经不再是空中楼阁,与传统驾驶模式相比,该技术具有保障交通安全、提升出行效率以及无需驾驶员操纵的优点,能够很好的缓解交通拥堵问题造成的恶劣影响。因此,对无人驾驶技术的研究
玉米是我国重要的粮食作物之一,提高玉米产量对我国粮食安全具有重要意义。地膜覆盖和高密度种植在一定程度上均可以提高玉米产量,但地膜覆盖技术推广的同时也带来了地膜残留
本文是一篇翻译项目报告,翻译项目选自于何锡章教授的《中国文化史专题》。译者选取了该书第五讲的内容作为翻译材料,共计11000多字。这部分内容主要讲述了中国人的经验本位
校园文化的建设对于高校的发展有着举足轻重的作用,高校学生社团作为学生课外活动的主要载体之一,在丰富校园文化、促进校园精神文明建设方面有着重要地位和作用。广州体育学院(以下简称为:广州体院)篮球社团作为校园篮球赛事的组织者,对校园篮球文化的形成、推动和发展起着重要的作用。本文以广州体院篮球社团为主要调查对象,以篮球社团对校园篮球文化的影响为研究对象。运用文献资料、问卷调查、专家访谈、实地考察、数理统
党的十八大以来,我国政治、经济、文化建设取得显著成就,社会大局稳定、人民安居乐业、国家兴旺发达。同时,社会治理实践取得重大进展。但是,近年来,在我国农村地区,一些地方黑恶势力利用家族、宗族势力横行乡里、称霸一方,破坏当地农村生产生活秩序,甚至把持基层政权、操纵破坏基层换届选举、严重损害人民利益,影响了党在人民群众心中的形象,阻碍了乡村振兴战略的实施。对此,2018年1月,国家决定开展为期三年的“扫
随着近几年机动车保有量的迅速增加,城市交通拥堵和环境污染等一系列问题日益严重。我国政府于2004年提出“公交优先”战略应对城市交通问题。但是目前我国大部分城市的公交分担率只有20%左右,远低于东京等发达城市。基于效用理论的公交出行行为研究较少考虑个体心理潜变量的影响,本文引入低碳消费行为中“态度-行为”缺口的概念,从低碳出行的视角研究城市居民公交出行行为的影响因素和“态度-行为”缺口存在的原因,定