基于时序演进的机器学习方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:samuraitruong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的机器学习中,往往假设数据的分布是固定不变的。但是在许多现实应用场景中,比如推荐系统中,数据的分布往往会随着时间的变化而变化,即存在着“时序演进”的现象。使用传统方法无法考虑“时序演进”性质,往往会使得刻画的数据分布不精确,难以对未来的数据进行很好的预测。随着生产生活中可获取数据量的不断增大、数据环境越来越复杂,传统方法在处理时序演进问题上的局限性也越来越凸显。如何快速而有效地利用数据“时序演进”的性质来提高模型的性能,近年来得到了越来越多研究者的关注。本文试图针对在线购物这一复杂的数据场景,考虑数据中“时序演进”的性质,尝试通过特征处理、空间嵌入等不同角度将数据的动态性转换为静态状态来处理,从而一方面能够较好刻画“时序演进”的性质,另一方面能够降低构建模型的难度。主要取得了以下创新成果:第一,提出了一种基于时间窗口特征的时序演进推荐算法。该方法通过不同宽度的窗口来从不同粒度上捕捉用户与商品随时间演进的特征,然后利用集成学习方法来学习这些静态的特征,从而得到一个具有“时序演进”特性的推荐系统。在腾讯公司提供的真实线上推荐系统中的应用效果,表明了该方法相对传统的推荐方法在推荐精度上有较大的提高。第二,提出了一种基于用户阶段演进的用户建模方法。该方法基于用户的交互数据,构建了一个静态低维的用户流形空间,将不同用户在不同时期所处的阶段进行对齐。在这个空间中,较为稳定的阶段的演进模式更容易被刻画出来。基于阶段演进的规律,我们就可以更深刻地理解用户的行为,从而对用户未来的行为也能有更好的预测。在使用腾讯公司提供的真实在线购物网站的数据的实验中,引入用户流形的推荐系统的推荐精度得到了明显提高,并且大幅超越了许多基准方法。同时用户流形空间的可视化结果也展示了用户流形空间可以很好地刻画用户动态偏好变化的模式。
其他文献
行为识别在运动监控、人机交互、健康生活引导以及老人孩子监护等方面有着重要的应用,并且已经在人们的日常生活中发挥着越来越重要的作用。然而,传统的行为识别方法却有着一
猪传染性胸膜肺炎(Porcine conagious pleuropneumonia,PCP)是由猪胸膜肺炎放线杆菌(Actinobacillus pleuropneumooniae,APP)引起的一种猪的传染性呼吸道疾病。自1987年我国首次发现此病,迅速在全国蔓延,目前已成为猪呼吸道疾病的主要疫病之一,对我国养猪业造成了巨大经济损失。本研究对2016年9月到2018年12月安徽地区疑似PCP感
泥沙输运和地形演变是河口海岸学研究的重要课题。为了合理模拟地形变化过程中泥沙运动问题,本文基于无积分节点间断有限元方法建立了波流共同作用下的二维泥沙数值模型,并在
研究目的由于具有良好的生物相容性和骨引导作用,羟基磷灰石(Hydroxyapatite,HAP)已作为骨植入材料应用于骨缺损修复和牙槽嵴增高等方面。然而,其机械性能欠佳,且植入体内后
创业活动能有力地推动国家的经济发展,随着近年来国家鼓励政策的提出,我国的创业活动也逐渐增多。我国是农业大国,农业领域也存在着丰富的创业机会,本文所研究的ZH公司正是从农业领域发掘了机会。该公司成立于2009年,经过十多年的发展,ZH公司已成为国内较大的湖羊养殖企业和具有科研创新实力的养殖基地,产销量一直保持省内前列。然而,在ZH公司初创期,它也面临着和大多数初创企业同样的困境——资源匮乏,那么如何
2-酮基-D-葡萄糖酸是用于食品工业中合成D-异抗坏血酸及D-异抗坏血酸钠的重要前体。D-异抗坏血酸钠又称异Vc,是重要的抗氧化剂和食品添加剂,其防腐效果比Vc显著,且价格不到Vc
自2008-5-12汶川Ms8.0地震与2013-4-20芦山Ms7.0地震发生以来,川南地震活动趋于活跃,尤其长宁地区,发生2019-6-17长宁Ms6.0地震。本文以构造地质学为理论基础,运用新构造、地震地质学及相关软件知识,将震后实地走访调查与资料收集结合起来,分析川南长宁地区地震构造环境,在此基础上进一步对川南长宁地区地震构造环境各个区域的不同特征做了简要分析,以期能对该地区防震减灾有一定
城市是人类生产活动最集聚的区域,城市的宜居性及其健康可持续的发展成为人类最关注的问题之一。城市热岛作为影响宜居条件的主要因素,自上世纪80年代以来便受到持续关注,有关城市热岛模式的研究层出不穷。长江中游城市群是长江经济带“三极”之一,有着九州通衢的重大战略意义。该区闻名世界的三大淡水湖:鄱阳湖、洞庭湖和洪湖,是世界冬季候鸟迁移、栖息的主要基地。长江中游的健康发展,不仅对中国经济生态的可持续发展,起
浸润性是固体表面的一个重要的性能,控制固体表面的浸润性对基础理论的研究和工业生产都具有重要的意义,近年来已引起了各个领域的极大兴趣。浸润性主要由固体表面的化学组成
次生火灾作为发生频率最高的地震次生灾害,其一旦发生则会造成结构力学性能的劣化,加剧结构本身的损伤程度甚至造成结构倒塌。然而,关于建筑结构在震后火灾作用下的性能研究只有少数人涉及,所以通过开展这方面的研究,为结构抗震和抗火提供设计参考依据,这对建筑结构在地震引发次生火灾后的应急具有双重的理论和现实意义。本文基于对钢筋混凝土板柱结构中柱节点抗震试验的损伤形式分析总结和受不平衡弯矩作用的板柱节点破坏机构