时序行为的状态建模与表征学习

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:ltxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时序行为数据广泛存在于各类应用系统中。如何挖掘时序行为数据中有意义的行为模式,捕捉用户潜在需求,进而提出更好的预测、推荐或运营策略受到了研究者们的广泛关注。本文提出的面向时序行为的潜在状态学习方法致力于实现离散稀疏行为数据的特征表达,在此基础上对用户的潜在状态及其复杂的时序依赖关系进行建模和学习,从而实现更好的时序推荐。然而,时序行为的状态建模和表征学习主要面临着以下三个挑战:(1)用户真实的行为状态往往是隐形的,如何根据显性的行为数据捕捉和推断行为的隐状态是其中的一个挑战;(2)行为事件空间是高维的,这意味在固定的时间段内可以观察到的事件样本往往是稀疏的,如何以较低的时间复杂度学习状态表征是另一个挑战;(3)行为伴随时间变化的模式往往具有个性化的差异,如何对用户状态的变化模式进行学习是一个挑战。针对以上挑战,本论文从用户行为潜在状态这一独特视角出发,将用户行为的动态变化分别建模成周期之间和周期内部两种依赖模式,进而利用基于模板的图神经网络结构来捕捉时序行为的状态变化。具体来说,本文提出了深度结构化状态学习系列方法,包括:基于层级表示的结构化状态学习(Structure State Learning based on Hierarchical Representation,HR-SSL)和基于变分推断的结构化状态学习(Structure State Learning based on Variational Inference,VI-SSL)。论文的主要工作包括:1)为了解决时序推荐中固定时间段内的行为稀疏和复杂行为依赖问题,提出了一种HR-SSL模型。根据时间段划分用户对项目的时序行为,然后采用最大池化层次结构学习项目的低维表示来表征行为序列的潜在状态。2)为了有效地提高时序行为的状态建模效果,从时序数据的状态表征角度来看,提出了VI-SSL模型。与基于学习项目表示的HR-SSL模型不同的是,VI-SSL模型假设状态的先验分布服从标准高斯分布,它直接学习时序行为在不同时间段的状态,并且联合学习基于协同过滤的VAE和基于GNN的状态依赖网络,同时在状态依赖网络引入个性化信号。3)从理论上分析了所提方法的时间复杂度,可应用于高维的时序数据中,并从实验结果分析了所提算法在各项评估指标上的优势,验证了所提出算法在时序推荐任务上相比于现有基准算法具有显著的优势。
其他文献
聚类是无监督学习中一种方法,它可以把数据切分成多个组别,并让较为相似的数据样本分到同一组别内。但是,传统的聚类方法大多是基于单个视角的数据,在多视角数据环境下往往不能取得令人满意的聚类性能。为解决这个问题,便提出了多视角聚类。多视角聚类的目的是整合多个视角数据的信息,获得更加本质的样本关系,进而求解出更加准确的分组。多视角图学习聚类是多视角聚类中的一类方法,该类方法会先学习出一个相似度图,并利用该
学位
从观测数据中推断出变量之间的因果关系是当今数据科学研究的热点。随着科学技术的不断进步,金融经济、社交网络、智慧医疗、大数据智慧城市等领域通过互联网交互产生了海量而复杂的数据。如何从这些观测数据中有效地挖掘出有价值的信息,探索数据中潜在的因果机制在科学研究的可解释性和辅助决策等方面都起着重要作用,它促进了很多科学领域的研究进展,如生物医学、社交网络、金融领域等。近年来,出现了很多从观测数据进行因果结
学位
传统互联网在服务质量、资源利用率、管控能力和传输效率等方面暴露出诸多弊端,智融标识网络通过全网多空间、多维度资源的智慧融合实现网络资源的灵活分配和个性化服务的按需供给,为新型网络架构提供一种可行的研究方向。在智融标识网络中,通过引入控制器集群可以有效解决单一控制器存在的可扩展性和可靠性问题。但当控制器与交换机的映射关系是静态配置时,波动的网络流量会导致集群负载分布不均,部分控制器可能过载以及响应时
学位
<正>数字人民币搭载以区块链作为底层技术的智能合约,是最为重要的创新之一,随着数字人民币试点的不断推进,智能合约的应用场景也越来越广泛。智能合约具有信用塑造功能,央行借助智能合约可以巩固货币的国家信用,提升履行职能的效率。文章通过梳理货币智能合约的技术架构与运行逻辑,发现治理货币智能合约存在的难题,据此从监管模式、监管重点、监管科技等方面提出对策,以提升数字人民币的治理水平。
期刊
行人重识别(Person re-identification)是一种利用计算机视觉技术进行行人图像检索的技术。随着人工智能技术的兴起,行人重识别技术得到了极大的发展。基于神经网络的行人重识别技术,需要先从各个摄像头中收集大量的行人图像,并对大量的行人图像进行标注。随后利用已标注的行人图像进行深度网络的学习,最终获得一个行人图像的检索器。但这类方法始终面临着各种困难:深度网络的学习需要大量的训练样本
学位
光频率梳由一系列离散等间距的周期脉冲序列组成,由于其频谱谱线数量多,而且谱线频率间隔相同,能够精准的测量未知频率,在激光雷达、光通信、天文学中有着大量应用。在正常色散区基于非线性Kerr效应产生的光频率梳具有平坦性好,泵浦效率高,相干性好等特点。基于非线性Kerr效应产生光频率梳主要有基于无腔光纤/光波导或微环谐振腔两种方式,本文研究了双频激光泵浦无腔非线性光波导基于超连续谱展宽产生光频率梳,以及
学位
离散事件系统是指由离散的事件触发而引起状态转移的一类动态系统模型。了解当前的运行状态对系统安全尤为重要,状态估计的可测性研究是离散事件系统的一个重要研究方向,并被成功应用于自动控制系统。在现实生活中,系统的状态和事件往往具有模糊和不确定的主观性,模糊集引入到自动机为模糊离散事件系统奠定理论基础,在生物医学和自动控制系统中具有广泛应用。本文研究了模糊离散事件系统下的当前状态和初始状态的可测性问题。针
学位
聚类分析是数据挖掘领域中的重要研究方向。在过去的数十年中,出现了大量聚类算法,其中,谱聚类由于其在非线性可分的数据中的优异表现而被广泛应用。此外,随着互联网的不断发展,网络中产生的数据也越来越多,形成大数据。因此,如何将谱聚类算法应用到大数据中,挖掘其中的有用信息变成十分重要的研究课题。然而,谱聚类算法存在严重的可伸缩性问题,谱聚类需要极高的时间复杂度和极高的空间复杂度来计算和存储相对应的拉普拉斯
学位
目的:探讨翻转课堂护理带教对产科胎心监护操作技能的影响。方法:选取2018年至2022年入职产科的新护士为研究对象,在胎心监护操作技能培训中使用翻转课堂护理带教模式,共计50人次。比较翻转课堂护理带教前后新护士的胎心监护知识、操作技能考核评分、对教学模式的认可程度以及学习能力变化。结果:翻转课堂护理带教后,新护士在胎心监护知识、操作技能考核评分高于带教前,学习能力评分高于带教前,差异均有统计学意义
期刊
在传统的图像分类问题中,训练一个模型需要依赖大量完备的标注数据。然而,随着现实世界的数据量不断增长,对数据进行人工标注变成了一项极其繁琐冗杂的工作。零样本学习可以有效缓解上述问题,具体而言,零样本学习可以在没有不可见类图像或视觉特征作为训练输入的情况下,利用有限的语义信息,对不可见类图像进行预测分类。因此,研究零样本学习可以使得算法、模型减少对图像类标签的依赖,减少人工标注数据的时间成本,极大地提
学位