基于自注意力和多任务学习的位置预测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shiluze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
下一个位置预测任务的目的是希望通过分析人类的移动轨迹数据,获取用户的移动行为规律信息,从而预测用户接下来最可能访问的位置,其在基于位置的社交网络服务中发挥着非常重要的作用。然而,实现准确、高效的位置预测仍然面临着诸多挑战。首先,人类的移动行为与时空因素高度相关,使得人们的出行规律经常表现出极其复杂的时空过渡模式。其次,轨迹数据存在稀疏性和异质性问题,严重影响了位置预测模型的移动规律建模效果。最近,大量基于循环神经网络的预测方法被提出用于下一个位置预测任务,虽然这些方法已经取得了显著的预测效果提升,但是其在长期规律信息建模以及模型计算效率方面仍存在进一步提升的空间。本文的主要研究内容如下:(1)为了有效捕获用户的移动规律信息,提出了一个基于时间上下文的自注意力网络位置预测模型。该模型利用所提出的两阶段自注意力机制在有限的内存资源下建模了更长的轨迹序列,有效地解决了循环神经网络长期规律信息易丢失以及计算效率低的问题,从而充分捕获了用户的长期移动规律。并且,该模型设计了一个多模态嵌入层,同时考虑了时序特征以及用户的个性偏好等多种因素,为位置预测模型提供了更加丰富的信息。最后在两个真实世界数据集上对位置预测效果进行了评估,结果展示所提出模型较最优基准方法在召回率指标上分别提升了12.57%和9.38%,证明了该模型性能的优越性。(2)为了进一步挖掘轨迹的全局时空序列特征,在时序自注意力位置预测模型的基础上提出了一个基于轨迹相似性度量的多任务位置预测模型。该模型将轨迹相似性度量任务作为辅助任务,通过多任务学习框架实现任务间的知识共享,从而帮助位置预测模型获取单任务情况下可能会忽略的潜在信息。并且,为了引入更多的空间因素信息,该模型设计了基于地理关键路径的轨迹相似性度量方法,可以有效地捕获影响人类移动行为的空间因素作用,从而实现更加优越的位置预测性能。最后在两个真实世界数据集上进行了大量的实验,实验结果表明所提出方法在两个数据集的召回率指标上分别取得了17.99%和18.84%的性能提升,验证了模型的有效性。
其他文献
近年来,应用张量分析解决可视化数据的恢复问题越来越广泛.以矩阵补全和主成分分析的矩阵形式为基础,将其推广至张量情形.但由于张量秩的定义的多样性,产生了不同的低秩张量补全(LRTC)模型和张量鲁棒主成分分析(TRPCA)模型.目前最为广泛的是基于张量Tucker秩和张量tensor-train秩的LRTC模型和TRPCA模型.相比于张量Tucker秩,张量Tensor-train秩更能体现张量的内部
学位
数学建模,曲线和曲面的构造以及形状保留是计算机辅助几何设计(Computer Aided Geometric Design,简称CAGD)中非常重要的研究领域。传统Bézier曲线由经典Bernstein基函数和控制顶点组成,具有对称性、端点性、非负性、线性精度、积分性、凸包性等优良特性。利用经典Bézier曲线的参数和几何连续性约束,可以很容易地构造任意曲线形状,但它的缺点是,设计者不能在不改变
学位
近十年来,得益于硬件设备的升级和计算机算力的指数式增长,深度学习在计算机视觉领域取得了巨大的成功,并且在诸多行业有了实际的应用。图像领域的研究趋近饱和,以及短视频数量的急剧增长,也让作为计算机视觉的一个重要组成部分的视频,越来越受到研究人员的关注。但是,由于视频本身具有的信息冗余性,时序性强,时间范围广等特点,基于视频的分析和识别仍然是一个较大的难点。本文通过不同架构的网络结构,在多个数据集上进行
学位
手势姿态估计在增强现实、虚拟现实以及人机交互等方面存在巨大的应用前景,一直以来是计算机视觉领域的重点研究方向。随着大规模手势姿态数据集的出现,基于深度图像的深度学习方法逐渐成为了手势姿态估计领域的主流方法。当前研究主要通过构建三维卷积神经网络进行手势姿态估计,致力于单一精度的提升,但通常导致模型复杂度过高、推理速度低下,难以满足实际应用、实时运行的基本要求。因此,为追求精度和实时性之间的平衡,本文
学位
源文本节选自美国作家古德里奇19世纪50年代所著的历史文献History of All Nations:Asia,所译部分为第104章至113章,共计28000英文单词。该翻译任务由导师发起,导师已与出版社签订合同,翻译该书用于出版。该书的翻译采用“机器翻译+译后编辑”模式进行,选择了拥有良好口碑的国产机器翻译平台代表——小牛翻译作为此次实践的翻译工具,进而评估小牛翻译在翻译历史文献时的真实表现。
学位
本项目实习报告基于笔者在烟台大学学报的摘要英译审校工作,实习时间为2020年1月至2021年9月,审校内容涵盖12期,共计145篇摘要。在项目期间,笔者的工作内容主要是审校烟台大学学报(哲社版)英文摘要,领域涉及哲学、文学、法律等。在项目准备上,本报告探讨了中英文摘要写作标准并分析了摘要文本特点,并在此基础上制定了审校质量标准,介绍了平行文本阅读过程、项目所需的工具和资源以及应急预案。在项目实施上
学位
本翻译项目的材料选自Cultural China一书,书中着墨最多的是儒家的人文精神,突显儒家一脉相承的批判精神。在全球化和本土化意识均日益强烈的今天,该书对于儒家文化的继承与传播具有重要意义,可以为相关学者提供很好的参考,具有一定的翻译价值。本项目选取了书中“人文精神与全球伦理”作为源文本。作为人文精神主题演讲,全文语言流畅,虽涉及部分儒学专业术语,但整体难度适中,重点在于向听众传达思想和观点。
学位
降维是机器学习和数据科学领域的重要研究方向,其应用包括但不限于数据预处理、数据可视化等。多数现有的降维算法获得可信低维嵌入的前提是输入数据具有稠密、均匀的分布特性,但这些方法往往在稀疏数据等缺陷数据上失效。因此,提高降维算法在不同数据情况下的通用性,是一项有意义且具有挑战性的任务。本文从鲁棒降维方法的角度出发,着眼于提高降维方法在缺陷数据上的适用性。基于线性、非线性与神经网络三种降维模型,本文工作
学位
生命过程通常复杂而精细,需要许多生物分子共同参与来完成。构建并分析生物网络有助于准确地认识生物分子的功能与作用,识别生命过程中的关键生物分子,从而辅助疾病诊断、药物研发等研究。本文研究了基于分子间关联关系的生物网络构建方法,和基于差异网络筛选潜在生物标志物的网络分析方法。具体研究内容如下:1.提出了基于加权弹性网络的基因调控网络构建算法WEN(Weighted Elastic Net)。由于基因之
学位
《孔子家语》,又名《孔氏家语》,或简称《家语》,按照今传本附《孔安国序》所言,该书与“《论语》、《孝经》并时”,乃“当书公卿士大夫及七十二弟子之所咨访交相对问言语”,即是一部记录孔子及孔门弟子思想言行的著作,因此被杨朝明盛誉为“孔子研究第一书”,虽在国内曾被一度视为伪书,但却在不同的时期被翻译成英、日、韩等多种语言,并对儒学在世界文化中的传播起到了重要作用。其中,与英国传教士赫真信的英译版及日本学
学位