社交媒体中基于用户生成内容轨迹发现和轨迹补充的研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:boge66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户在社交媒体中发布的信息中可能携带着位置信息,对于不包含准确经纬度定位信息的内容,可对其分析时间和空间维度以获得用户位置的跟踪。传统的轨迹探测方法其主要缺陷在于,在检测非标准用户内容时,它对于轨迹识别的模糊内容的容错能力以及识别精度均较低;此外,对于能记录携带经纬度信息的轨迹位置信息的场景,往往由于设备的续航问题使得轨迹的补充必不可少。本文的主要的研究内容包括:1)提出基于树索引的用户轨迹发现方法。本文提出一个全局的位置识别方法,能够处理用户生成内容(如微博等)包含的位置信息,使用多条用户生成信息的位置标识不仅可以探测用户潜在感兴趣的位置,而且还可以补齐用户生成信息的位置数据。论文在两种公开数据集上对比了本算法的原始版本和优化版本,分别在用户生成内容UGC(User Generated Contents)最优位置和用户最优位置的准确率上有小幅提升,在召回率上有较大提升。与两种现有算法对比,基于树索引的方法在F-值与效率上均有较大提高。本工作的主要创新点在于:加入位置模糊处理,能纠正当前其他主流方法的位置错误信息;采用树结构匹配,能利用全部的用户生成内容中的位置信息,提高召回率;采用剪枝和链表存储,以空间换时间,提高算法效率,并大幅提升数据规模增大时的稳定性。2)提出基于循环神经网络的编解码机制的轨迹补充算法TCED(Trajectory Completion Encoder and Decoder)。该算法通过无监督的自动编码机获得轨迹的编码方式,继而通过端对端的模型结构学习兴趣点的特征。模型获得轨迹的起始点和终点及轨迹的长度,输出轨迹的起始点和终点之间的轨迹补充。为提高性能,该模型融入注意力机制以获得对轨迹输入片段中影响更大的兴趣点的重视。此外,模型引入集束搜索的思想以获得更优的效率,并使用重构器缓解轨迹补充过程中搜索结果的次优问题,与主流轨迹补充算法相比验证其有效性。
其他文献
随着轨道交通系统与铁路系统的发展,安全性必须处于首要考虑地位,钢轨探伤则是保障列车安全运行的必要环节。当前我国钢轨探伤基于传统的超声波检测技术,在钢轨轨底区域存在探伤盲区,容易造成漏探、误判。而超声导波无损检测技术具有检测距离长、全截面检测、检测效率高等优势,特别适用于细长型构件的检测,若能将其应用于钢轨探伤中,对保障铁路与轨道交通系统的安全运营以及提高基础设施检测水平具有重要的理论与现实意义。本
自2018年以来,我国已经相继出台40余条扩大金融开放的措施。到2020年,我国将实现金融业开放措施的按时落地。我国金融业的对外开放正在有序、加速地进行。自2017年放开外资银行跨境混业经营的监管以来,外资银行的资产总额出现爆发性增长,截至2018年,外资银行资产总额为4.42万亿元。在外资银行进入限制不断放开的背景下,本文旨在分析影响外资银行发挥作用的因素,验证外资银行进入对我国商业银行经营效率
二维过渡金属硫属化物(TMDs)已被证明了拥有高载流子迁移率、禁带宽度对于紫外到近红外光波段理想以及与材料层数相关的能带结构等有利于光探测器应用的优秀性质。迄今为止,一系列性能优秀的二维TMDs基光探测器已被制备出来。然而,其中多数的报道都是使用剥离法或化学气相沉积法等的制备技术,有样品尺寸小、不可控、生产规模小以及生产过程不洁净的缺点。目前大量关于TMDs基光探测器的报道都是围绕二硫化钼、二硒化
钢筋混凝土梁斜截面抗剪性能是钢筋混凝土理论体系及结构设计中非常重要的一个内容,但由于影响抗剪承载力的因素众多,合理地解释其抗剪机理并给出准确的抗剪强度预测值仍是一个非常具有挑战性的问题。一百多年以来,不同国家的众多学者提出了一系列抗剪分析理论,例如经典桁架理论、变角桁架理论、拉压杆模型、压力场理论、修正压力场理论、简化修正压力场理论等。其中,修正压力场理论是一种被很多学者认为较为准确有效且被一些国
随着社会发展和生活水平的提高,人们越来越重视健康,并希望及早发现身体内潜在的疾病,防患于未然。柔性可穿戴式设备具有体积小、重量轻及穿戴简便舒适等特点,可对人体生理信号进行实时采集和连续监测,从而实现疾病的早预防、早发现,因此越来越得到广泛关注。柔性可穿戴式设备中的关键部件为高性能的柔性传感器,其中,柔性应力传感器因制备工艺简单、柔性可拉伸、贴敷性好以及探测信号丰富等优点,被广泛用于人体生理信号的实
公立医院在发展改革过程中所面临的一项迫切任务就是有效地管理大型医疗设备,加强投资效益分析、评价与考核,从而合理配置资源,提高资源利用率。我国大部分公立医院中,医疗设备中价值100万以上的大型医疗设备资产占全部固定资产的比重都过半,只有科学有效地管理好大型医疗设备,让其价值得到充分发挥,才能对医院产生巨大的效益,这是公立医院谋求出路的迫切任务。而当前我国公立医院在对大型医疗设备的投资效益进行考核评价
随着化石能源减少和环境污染的日益加剧,分布式能源被越来越多的开发利用,但是分布式能源不能直接接入到电网中,因此微电网的概念被提出从而更好地利用分布式能源,以减少对电网的影响。目前在微电网研究中,直流微电网能够友好接纳分布式电源,为用户提供优质的电能。相比于交流微电网,直流微电网减少换能装置,提高了能源利用效率。此外,直流微电网具有结构简单、各单元间协调控制简单等优点。因此,对直流微电网的研究具有重
舒适宜人的光环境对于健康建筑至关重要。已有大量研究证实了不恰当的光环境会影响人体褪黑激素分泌,影响人体节律,甚至导致一系列生理与心理疾病。同时,人们还设定了若干标准体系判断建筑光环境是否满足健康要求。屏幕设备扮演着信息源与光源的双重角色,影响着其所处的空间光环境。作为建筑空间中的新元素,屏幕被广泛用于各类建筑空间场景下,且在现代科技技术不断发展的进程中,有可能进一步演进为建筑的全新界面,重构建筑空
随着科学技术的飞速发展,电力设备的快速普及,接入电网的敏感元器件以及精密仪器逐步增多,生产生活对用电质量的要求达到了前所未有的高度。同时大型整流设备的运用以及电网覆盖面积的增加使得各类电能质量问题日益加剧,这些电网中的干扰不仅会影响电力系统的正常工作,甚至会造成设备损坏带来巨大的经济损失,因此构建高速精准的分析方法成为当下研究的热点。压缩感知作为新兴的信号分析方法,有着速度快、精度高等特点,尤其是
本文主要研究了从造纸厂碱性土壤中筛选得到的,能够产生耐碱木聚糖酶的两株放线菌X24-14和X15-17。通过16 S rRNA基因序列分析并结合菌株的形态特征以及生理生化特性,初步认为菌株X15-17为拟诺卡氏菌属(Nocardiopsis)的一个潜在新种;菌株X24-14为纤维化纤维菌(Cellulosimicrobium cellulans)。在此基础上探索了菌株X24-14和菌株X15-17