基于多模态轨迹数据的城市空间感知研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:liqiuru1025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会,各种智能化设备的兴起贡献出大量的轨迹数据,如车载GPS、手机、公交卡等。这些轨迹数据包含着丰富的人类行为信息,可以通过多模态轨迹数据挖掘,从而实现多种应用。用户的轨迹数据包含着丰富的语义信息,它在一定程度上体现着用户所在城市的变化,挖掘用户的轨迹数据在个性化推荐、城市规划、安全等领域起着越来越重要的作用,因此轨迹数据的研究越来越受到相关学者的关注。随着城市化的发展,用户轨迹数据日益增多,如何从海量的轨迹数据中挖掘有用的信息面临着巨大的挑战。并且人类的轨迹多种多样,如何从中挖掘人类社交关系与移动模式面临着许多难题。截止到目前,国内外在这方面的研究已经取得一定的成果,研究的内容主要是移动模型聚类、异常轨迹数据检测、轨迹预测等,其中很大一部分研究重点关注在在线社交网络和单源轨迹数据,在捕捉用户离线物理空间中的社交关系和多模态轨迹数据挖掘方面的研究较少,并且以准确的方式构建用户的移动模式和寻找相似的城市兴趣点仍然是一个具有挑战性的问题。基于以上问题,本文提出一个用户社交关系学习与城市物理感知学习框架并重建用户离线社交结构与城市物理空间结构,其中包括用户社交空间感知和物理空间感知两大部分的研究,主要工作如下:第一,在用户社交空间感知方面,本文使用WiFi技术进行被动定位采集用户轨迹数据,在处理无线信号的稳定性方面,本文提出使用滑动窗口的解决方法。为了高效获取用户数据,本文将MAC地址标识用户并提出了过滤机制的方法,分析了采用不同数量的WiFi探测器对定位精确度的影响。另外,本文提出一种检测用户协同位置的方法并利用用户之间的协同位置信息构成用户社交上下文信息,这种方法可以从个人层面获得用户更详细的社交信息和确切的互动信息。重要的是,本文使用skip-gram模型对包含丰富社交关系的上下文信息进行学习并改进了负采样的选词策略,运用余弦相似度原理重构用户社会结构,并利用t-SNE将高维的词向量投影到2D空间进行离线的社交关系解释。本文也定义了不同用户之间的社交距离并以此对用户之间的社交结构进行视觉检查。最后,本文定义了用户的社交群组,应用DBSCAN密度聚类算法验证用户的社会结构、F-Measure算法评价聚类结果。第二,在城市物理空间感知方面,本文将用深圳市公开的用户轨迹数据,包括手机轨迹数据、交通卡的轨迹数据、出租车的轨迹数据与公交车的轨迹数据。为了更好地表达点分布模式的局部差异,本文选择500m作为理想阈值将深圳市切分为上千个区块,并将多模态的轨迹数据按照一个小时的间隔切分为子数据集,对不同时间段的轨迹数据进行去重、排序、去噪等处理,使用PNPoly算法判断用户轨迹所在的区块,然后根据用户轨迹数据的时序性建立区块之间的连接,通过构建区块之间的有向连接图构建移动模型。在兴趣点提取方面,本文定义了兴趣点功能性分类,同时提出一种兴趣点排名算法POIRank,量化了不同功能区域对城市的影响。对比深圳市总体规划(2010~2020年)和借鉴相关学者对深圳人口日变化的分布规律研究的成果,实验表明兴趣点排名算法产生热点区域整体上符合物理上存在的兴趣点分类。最后,本文提出一种方法组建城市兴趣点上下文信息,使用skip-gram模型挖掘一天中不同时间段兴趣点之间人类移动模型,找出相似的兴趣点并对相似兴趣点进行聚类与评估。实验结果证明本文可以有效地重构真实的用户社交结构和物理空间结构,并可以进行准确的社交关系解释和物理空间解释。
其他文献
当下社交网络高速发展,各类信息数量成指数式的爆发增长,人们生活,社交,娱乐,阅读更加依赖于社交网络。为了满足人们日益增长的快速获取信息的需求,互联网中诞生了诸如微博,
随着虚拟化技术的快速发展,基于虚拟化技术的云计算平台的构建现在越来越完善。越来越多的人使用云平台完成任务部署。由于用户的全球化,区域化趋势变得更加突出,近年来基础
全世界各个国家的科技发展规划中都将性能优异的航空发动机研发与制造计划摆在非常重要的地位。压气机的性能往往能够对航空发动机产生直接的影响,因此,高性能航空发动机对压
肺癌是全世界发病率最高的癌症,其死亡率在所有癌症中居首位,对人类生命有重大的威胁。研究表明早发现肺癌并进行治疗,能够降低肺癌患者的死亡率,然而肺癌在早期没有非常明显
铀是核裂变的关键元素。随着人类对非化石能源的需求持续增长,铀的使用量不断增加。但铀又具有放射性和毒性并能在生物体内累积,且铀酰易溶于水溶液中,在环境中产生迁移。因
随着我国城镇化进程逐年加快,商用建筑能耗不断攀升,空调能耗已占据建筑物总能耗的40%以上。作为空调系统主机的冷水机组,其运行能耗约占系统总能耗的60%。降低空调系统能耗
复杂工程系统在运转周期内产生的监测数据可以直接用于反映系统整体的状态特征,为决策层在线分析、故障诊断以及深度挖掘等操作提供数据支持。然而在系统运行过程中,监测数据
移动边缘计算(Mobile Edge Computing,MEC)作为分布式计算中移动云计算技术的优化,是5G系统中的关键技术之一,旨在将远端中心服务器的部分资源分散到部署在无线接入网络、离
随着社会的发展和科学技术的不断进步,各类机器人逐渐进入到了人们的生活、生产及工作中。以城市救灾、反恐排爆、军事侦察等为应用领域的小型移动机器人需求越来越迫切,而目
国民经济的持续发展依赖于充足的电力供应,为大力开发清洁能源和保障国家的能源供应安全,分布式电源(Distributed Generation,DG)并网迅速发展,智能电网应运而生,配电网是智