基于隐式反馈特征的Stacking融合模型的推荐算法研究——以音乐、阅读平台为例

来源 :兰州大学 | 被引量 : 0次 | 上传用户:nannoha2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技的快速发展,使得“互联网+”被越来越广泛地运用于各个领域,比如数字音乐。推荐系统不仅能够帮助用户快速定位目标,而且有利于公司实现利益最大化。因此,推荐引擎饱受青睐,其核心部分就是所谓的推荐算法。传统的推荐算法虽在一定程度上能够解决信息过载问题,但对于解决数据稀疏性、个性化能力不足等问题效率低。针对以上问题,本文提出一个效率更高的算法:引入隐式反馈特征的Stacking融合模型。该算法首先以用户交互行为等数据为基础,利用多维度提取法和时间修正因子对特征进行构造提取,从而完善了特征体系,解决了特征稀疏性问题。其次,利用本文提出的Stacking融合模型对构造的特征进行处理,提高预测的准确率。本文的Stacking融合模型主要是以Light GBM、XGBoost、Cat Boost模型作为初筛选器,并将三个模型的预测结果作为逻辑回归模型的输入数据,得到最终的预测结果。随着人们生活品质的提高,音乐以及阅读已经逐渐成为人们生活中不可或缺的一部分,众多的音乐平台以及阅读平台也随之涌现。本文利用音乐数据集和新闻数据集进行实证分析,通过性能测评指标来衡量前面提到的Stacking融合模型的有效性。实验表明,在音乐数据集上,Stacking多特征融合模型的AUC值比单一Light GBM算法提高了17%,达到86%;在新闻数据集上,多特征融合模型的AUC值达到82%,证明了该融合推荐算法有效。
其他文献
众所周知,管道在输油、输气、调水、核电及化工等重大工程中有着不可或缺的作用,但是随着使用年限的增加,管道内壁难免会由于腐蚀、流体冲击、摩擦等作用降低管道的使用性能甚至使其无法正常工作,从而减少使用寿命,所以对管道内壁进行定期检查就显得极其重要。但是,目前的涡流、漏磁及超声波等方法大多是对管道内腔缺陷进行检测,而无法确定缺陷的具体三维形貌,限制了检测人员做出高效、合理的应对措施。为此,论文提出了一种
学位
针对Riesz分数阶对流扩散方程离散后的线性系统,本文研究了该线性系统中Toeplitz结构的系数矩阵的生成函数,并运用该生成函数的理论分析了此类Toeplitz矩阵的特征值范围.在此基础上,建立了双参数分裂迭代法收敛性的简化证明,并通过该迭代法构造了双参数分裂最优循环预处理子.理论和数值结果都表明了,预处理后的矩阵的特征值是聚集的并且都聚集于1,从而很好地加快了Krylov子空间迭代法的收敛速度
学位
(5,6,7)-富勒烯图是指3-正则平面图且仅含有五边形面、六边形面以及七边形面,它也是通常富勒烯图的推广.对一个(5,6,7)-富勒烯图,一个六长面圈称为共振的若它的边界(或它本身)是一个-交错圈,其中是图的完美匹配.(5,6,7)-富勒烯图的环链是指由9)个面圈的圆形排列形成的子图,使仅有两个相继面圈含有公共的边且这些公共边都是独立的,记作[(a1,(a2,...,(ai)],其中(ai)∈{
学位
大数据、云技术、人工智能等科学技术日异月殊,推动社会经济、物质生活以及人类思想意识不断进步,与此同时也产生了信息泄露、网络诈骗、病毒传播等复杂问题。金融作为国家重要的核心竞争力之一,防范和化解金融风险是金融工作的根本性任务。近年来我国金融产品和服务日新月异、琳琅满目,但也存在金融欺诈、理财乱象、金融消费者投诉量增多等风险和问题。国内多位专家学者也提出借鉴美国消费者金融保护局的经验建立系统化、科学化
学位
锅炉水冷壁容易出现腐蚀、爆管等缺陷,这严重影响着火电机组的安全运行。电厂锅炉存在内部空间较大、温度较高、检测孔口较小等问题,人工检修效率较低且易出事故。四旋翼无人机是近年来发展较快的一种飞行器,因其具有垂直起降、定点悬停、操作简单等众多优点而被用于工业巡检。本文设计了一款面向锅炉进行巡检作业的高负载折叠式耐高温四旋翼无人机用于锅炉缺陷自动化检测,并基于ANSYS仿真软件验证了无人机结构强度和高温环
学位
文本数据具有非结构化特点,很难被计算机识别,因此需要对文本数据进行向量化表示.其中能否合理有效的表示文档信息是影响文本分类性能的显著因素,因此需要选取合适的文本表示方法.本文具体工作如下:本文通过融合潜在狄利克雷分配模型(LDA)和Word2Vec词向量模型即建立LDA_Vec模型来对文本数据进行表示,经实验表明该表示方法优于LDA+Word2Vec模型表示方法的分类效果.在模型建立的过程中,由于
学位
天气对人类的交通、农业、工业等方方面面都有重要的影响,天气图像识别在人工智能、公路交通状况预警、汽车辅助驾驶、气候分析等领域具有广阔的发展前景.由于采集方法和采集设备不同,天气图像大小不一,常规预处理方法会导致信息损失;同时,天气图像容易受到复杂的、非系统的因素干扰,因此天气图像识别存在分类精度不高的问题.此外,天气图像数据集通常数量庞大,如何进一步提升天气图像识别速度是亟待解决的问题.对此,本文
学位
柔性铰链(柔铰)是在外部载荷作用下利用其自身材料的弹性形变实现相邻杆件运动传递的一类特殊运动副,具有高精度传动、无间隙、无摩擦磨损及免润滑等优点。现有理论模型主要面向单、双轴拉伸缺口型柔铰展开,现有同轴回转缺口型柔铰的结构类型较少、理论模型准确性及通用性不足。但随着增材制造等新型加工方法的发展及空间多自由度柔性精微定位需求的增加,对同轴回转缺口型柔铰相关结构概念表征、理论柔度精度及应力水平进行深入
学位
胸片诊断作为诊断新冠肺炎的手段之一,能够分担一部分分子测试所带来的压力.而机器学习算法尤其是深度学习算法在医疗图像诊断领域彰显了其强大的学习与预测能力,利用目标检测算法可以帮助放射科医生更快地定位新冠肺炎患者的病变位置,来辅助诊断、量化和预测新冠患者的发病程度,以便更好地调度医疗设备等资源,从而有效抑制新冠疫情的爆发.本文旨在帮助放射科医生更准确快速地诊断新冠病毒患者,使医生能够判断新冠患者疾病的
学位
在数字时代,随着信息存储与获取的便捷性,大量的个人数据被企业存储,企业和消费者间的数据互动已成为普遍现象。同时,通过窃取企业或消费者数据以获利的不法行为已呈现不断加剧的趋势。因此,企业和消费者不得不面临便捷与安全的困难抉择。通过采取有效措施保护自身的数据安全,减少或防止数据泄露已成为两者共同的强烈需求。最近的研究表明,数据泄露量具有偏态性,稀疏性与变异性等特点,这对行业数据泄露量的建模与预测产生了
学位