基于自动去噪算法和深度学习的混合推荐算法模型的研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:nxbys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,推荐系统被应用在越来越多的场景来缓解信息爆炸的时代用户信息过载的问题,一个好的推荐系统可以大量减少用户在寻找所需信息过程中花费的人力和时间,提高用户的体验感,为企业创造利润。因此,如何提高推荐系统性能,快速的在大量信息中筛选出用户的所需信息成为了时下一个炙手可热的研究课题。经过多年的发展,传统的简单推荐模型已经不能满足用户日渐丰富的信息,越来越多的研究尝试将深度学习用于推荐系统领域来实现推荐系统的智能化。本文针对推荐系统相关算法进行研究和应用,尝试将梯度提升决策树GBDT(Gradient Boosting Decision Tree)以及深度学习模型 WDL(Wide and Deep Learning)相结合,来实现一种可以实现自动化特征交叉的组合模型GWDL,并引入堆栈去噪自编码器SDAE(Stacked Denoised Autoencoder)技术。基于以上基础,本文研究并实现了混合推荐算法SDAE-GWDL,旨在提高原基础模型WDL各方面的性能,并将混合模型实际应用在电影推荐场景,来验证改进后模型的可用性。为了达到以上目标,本文主要研究工作如下:1.对WDL模型的特征工程部分进行研究,提出将GBDT决策树和WDL模型结合,从而解决深度学习模型WDL中需要手工特征交叉的问题,提高模型挖掘用户高阶特征的能力。2.对模型输出层部分进行研究,改进模型输入层的设计。3.对堆栈去噪自编码器进行研究,针对实际推荐场景中特征数据稀疏的问题,提出将SDAE与上述GWDL模型相结合,旨在提高模型推荐结果的准确度和去噪能力,并改善模型的冷启动性能。本文通过在三个推荐模型训练常用数据集(Movielens数据集、Lastfm数据集和Jester数据集)上进行模型的性能测试实验,采取Precision、AUC(Area Under the Curve)、Recall作为实验的评测指标,将三个数据集上上述评测指标的平均值对新模型的性能进行评测,实验结果表明,基础模型的Precision、AUC、Recall分别为0.7397、0.8401、0.5591,改进后模型的指标值分别为0.7626、0.8777、0.5934,三个指标均有不同程度的提升,验证了该算法模型在推荐方面的性能提升。此外,本文还评测指标mAP(mean average precision)对模型的冷启动性能进行了评测,结果表明改进模型的mAP在原模型的基础上平均提升了 2.45%。本文研究并提出的SDAE-GWDL算法模型可以提升推荐结果的准确度,改善推荐系统的冷启动性能。基于以上对推荐模型的研究,本文设计并实现了基于Django平台和改进后融合模型的个性化电影推荐系统。该系统实现了高效的个性化电影推荐功能,并且经实验验证融合模型的加入可以提高推荐结果的准确性以及改善推荐系统的冷启动性能。
其他文献
自从机器学习提出以来,计算机的应用范围越来越大,人工神经网络也引领着人工智能领域的研究,近几年,类脑计算的方法发展越来越迅速,特别是自从脉冲神经网络(Spiking Neural Networks,SNNs)的提出,类脑计算的发展到达了高潮。本文利用类脑计算的方式进行了关于图像识别的研究,具体内容如下:首先,介绍了类脑计算的研究背景和意义,综述国内外类脑计算的研究现状,阐述了本文的研究内容和技术路
为了解河北省唐山市祥云湾海洋牧场人工鱼礁区和对照区微塑料分布情况及其污染程度,于2020年7—8月对其表层海水的微塑料进行了调查研究.结果表明:祥云湾海洋牧场共检出8个颜色3种类型的微塑料,主要是蓝色和黑色的纤维类、薄膜类和颗粒类,材质为聚对苯二甲酸乙二酯(PET)、聚乙烯(PE)、聚丙烯(PP)和尼龙(PA)等;人工鱼礁区和对照区微塑料粒径主要集中在1 mm及以下,分别占各自区域总数的74.85%和74.15%;人工鱼礁区微塑料平均丰度为(0.82±0.16)个/L,对照区平均丰度为(0.88±0.33
为探讨超声波辅助聚葡萄糖渗透预处理结合真空冷冻-热泵联合干燥罗非鱼片的品质及其后期贮藏稳定性,采用静态称重法测定真空冷冻-热泵联合干制罗非鱼片在25、35、45℃时及水分活度(aw)为0.1116~0.8434时的解吸-吸附等温线,选取8种常见的数学模型对解吸-吸附等温线数据进行拟合,通过决定系数(R2)和均方误差(EMS)确定解吸-吸附等温线的最佳模型,再根据干制罗非鱼片在不同温度下的解吸-吸附等温线数据获取干制罗非鱼片的热力学性质.结果表明:干制罗非鱼片的水分解吸-吸附呈Ⅲ型等温线,Peleg模型是描
鱼类年龄鉴定是鱼类生态学与渔业资源评估的基础和前提.不同鱼类的年龄鉴定方法目前还无统一标准,通常是几种方法相互补充与验证,但应用最广泛的仍是硬组织年轮法,即基于耳石、鳞片等钙化组织的生长纹结构鉴定年龄.近几年,利用眼晶状体鉴定鱼类年龄有了新的进展,特别是在软骨鱼类中有些新的应用.本文系统梳理了基于鱼体不同硬组织(包括钙化组织和晶状体)鉴定年龄的原理与应用,综述了鱼类硬组织年龄鉴定领域的最新进展,并就鱼类年龄鉴定的精度评价、潜在新方法、数据读取可视化等方面提出未来研究建议,以期为鱼类生长与年龄鉴定研究及应用
为研究不同水层海水温度对西南大西洋阿根廷滑柔鱼Illex argentinus公海渔场的影响,基于50、100、200 m水层海水温度建立了栖息地适宜指数(habitat suitability index,HSI)模型,根据2013—2017年1—4月西南大西洋公海渔场阿根廷滑柔鱼的捕捞数据与50、100、200 m水层水温数据,基于捕捞努力量计算每个月份不同水层海水温度的适应性指数(suitability index,SI),设立10种权重方案建立综合HSI模型;将HSI≤0.2、0.2
副乳房链球菌Streptococcus parauberis是引起牛源和鱼源链球菌病的主要病原菌,该菌分布广、致病力强,曾给世界范围的鱼类养殖业造成重大经济损失.副乳房链球菌最初被认为是乳房链球菌S.uberisⅡ型,后经分子鉴定确定为新种,可感染包括海淡水、养殖或野生等众多鱼类发病,出现类似败血特性的临床症状,温度是其流行暴发致病的最主要诱因.根据荚膜多糖结构差异可将副乳房链球菌分为多种血清型,不同血清型对宿主的致病力不同.常规生理生化鉴定较难准确鉴别副乳房链球菌,基于PCR技术的分子鉴定是该菌的最常用
近些年来,随着我国经济突飞猛进的发展,生猪养殖业的发展也越来越快,生猪感染疾病的几率也变得越来越大.猪伪狂犬病就是其中一种传染性极强的疾病,严重危害生猪的健康,一旦大面积发病就会给养殖户造成不可估量的经济损失.因此,养殖户要对本病引起高度重视.本文将针对猪伪狂犬病的流行特点、临床症状、病理变化、诊断和防控措施进行综合分析和总结,希望可以为生猪养殖户提供一些有价值的参考.
2019年8月我国新疆伊犁地区首次暴发牛结节性皮肤病(LSD),在不到一年内结节性皮肤病病毒从我国最西北部传到最东南部诸省区,之后LSD疫情迅速传播和扩散,2021年又波及我国多个省市区,呈大流行态势,对我国养牛业特别是奶牛业造成巨大危害和威胁.近年来,世界上特别是俄罗斯等国家又发现了LSD疫苗样疾病以及新的变异毒株,对LSD的防控提出了新挑战.为做好这一外来病的防控工作,通过LSD疫情流行现状与趋势、发现的新流行毒株与问题,探讨我国LSD防控的新策略,为有效控制、净化和根除该病提供指导.
秋冬季猪场流行性腹泻病发病率急剧上升,是目前继非瘟、蓝耳病之后第三大猪烈性传染性疾病.在2010年底,中国多个地区报道了严重的猪流行性腹泻病疫情,经鉴定该腹泻是由变异毒株引起.通过对该病防控难点进行分析,制定综合防治办法,以此降低流行性腹泻所导致的危害和损失.
猪瘟是一种对我国养猪业造成经济损失最严重的疾病之一.这种疾病主要是由猪瘟病毒感染引起的,并且该病传染性高、致死率高、传播速度快.目前已被我国列为一类动物疫病,并且也被世界卫生组织列为了必需报告的疫病.猪瘟主要依靠消化道进行传播,病猪及携带病毒的猪是主要的传染源.目前对猪瘟的鉴定主要依靠临床诊断和实验室诊断.为有效预防猪瘟的发生,提高我国养猪业经济效益,本文主要从猪瘟的发病原因、发病症状以及猪瘟的诊断和防控出发,阐述猪瘟病毒的特点及危害,以期为我国养猪业减少该种疫病的发生提供指导.