轨迹数据挖掘关键技术研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:qiuyuwusheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定位技术与位置社交网络高速发展的背景下,轨迹数据呈爆炸式增长。轨迹数据包含移动对象的时空特征和移动行为信息,挖掘海量轨迹数据背后所蕴藏的丰富信息,既有理论研究价值也是紧迫的现实需求。轨迹数据挖掘是城市计算、智慧城市等未来城市服务的主要研究方向,广泛应用于交通疏导、城市应急服务响应、位置预测与推荐、群体移动感知、社交行为分析等领域。然而,轨迹数据挖掘在实际应用场景中仍面临一些问题。首先,由于轨迹数据语义缺失,人们无法理解轨迹数据中隐含的语义特征;其次,轨迹点序列式的表征方式无法适应于广泛的数据挖掘模型;再次,现有的位置预测模型的预测精度较低无法满足实际应用的需求。为此,论文围绕轨迹语义推断、轨迹表征学习、位置预测性能提升三个关键技术开展研究工作。论文的主要研究内容和研究成果如下:(1)针对轨迹语义缺失的问题,论文提出一种基于图卷积神经网络的位置语义推断模型(SI-GCN)。与现有手工提取位置特征或运动模式的方法不同,SI-GCN利用网络表征学习算法和变分自编码器分别学习位置的空间向量表征和时间向量表征,构成位置的时空特征。同时SI-GCN构造用户-位置访问二部图,采用图卷积神经网络学习用户签到活动中的高阶信息。此外,SI-GCN引入自注意力机制,区分用户-位置访问二部图中邻居节点的不同影响。SI-GCN在两个真实用户签到数据集上的实验结果表明,SI-GCN的语义推断性能优于现有方法。(2)针对轨迹表征困难的问题,论文提出融合时空结构的轨迹数据表征学习算法(STAR)。传统轨迹点序列表征方式割裂轨迹数据的时空耦合关系,且不适应于广泛的数据挖掘模型。STAR建立统一框架学习轨迹中的空间和时间信息,利用词向量表征学习算法学习轨迹空间信息,并丰富位置的上下文信息,包含地理上下文、轨迹上下文、语义上下文,利用自适应霍克斯过程建模用户出行时间信息。STAR利用轨迹向量表征作为桥梁连接空间表征与时间表征,通过轨迹向量表征和自适应霍克斯过程预测下一个访问位置和时间的过程,自动学习轨迹向量表征。相比于现有轨迹表征方式,STAR融合轨迹数据中的空间与时间信息,输出轨迹在特征空间的表征向量。STAR在相似性检索、相似度度量、异常检测等数据挖掘任务优于现有方法。(3)针对个人出行数据随机性高、数据稀疏,导致现有位置预测模型精度较低的问题,论文提出基于偏好社交互动的位置预测算法(PSI)。PSI通过引入群组出行模式,利用群组层面的出行模式缓解个人出行随机性对预测模型的影响。为了刻画群组层面的出行模式,算法通过度量用户轨迹相似度构建用户群组,利用关联规则挖掘算法提取群组出行模式,然后建立个人偏好模型。通过岭回归学习个人偏好与群组出行模式对位置预测的贡献,预测用户出行位置。与现有方法相比,引入群组级别出行模式的PSI,提高偏好社交互动模型的鲁棒性,减轻数据稀疏性对模型的影响,位置预测性能优于现有预测算法。(4)针对用户签到行为的成因与动态机制缺乏深入研究的问题,论文提出地理感知的用户行为动态模型(DGPS)。DGPS同时考虑地理感知的用户偏好和由社交关系引起的社交互动激励驱动用户签到行为,学习用户签到行为的动态机制。其中,建立地理感知的位置特征(包括语义特征、潜在特征和动态特征)用于表征位置信息并揭示位置的地理影响的演化,利用地理感知位置特征,模型学习用户个人偏好。DGPS利用时间点过程建模用户签到行为学习用户行为的动态机制,将地理感知的用户偏好和社交激励嵌入用户行为的强度函数中分析签到行为成因。通过研究用户签到行为成因与动态机制,DGPS能够同时预测用户签到活动的位置与时间。多个真实数据集上的实验结果表明DGPS预测性能优于现有方法。
其他文献
随着社会对学生教育的日益重视,国家推动教育改革,开始施行新课程标准,要求教师改变传统低效的课堂教学模式,打造高效高质量课堂,引导学生拓展思维,全面发展。对于高中物理来
患者女性,62岁,绝经20余年,因体检发现盆腔包块1个月余收入院。盆腔核磁示:盆腔巨大混合占位,考虑右侧附件来源囊腺癌。有间断性下腹痛,伴尿频,无阴道不规则出血,无体重减轻;
本报告用数据论述了2009年塑编行业急剧增长的产业全貌,同时论述了产业十大热点:产业复苏急剧增长、新产业集群在形成、技术创新层出不穷、节能降耗如火如荼、食品认证进入尾
禾谷类作物中耗水最少的作物是糜子,它有很强的耐病虫、耐盐碱、耐瘠等特性,在作物中是较少有的,是盐碱地和沙荒很有前途的作物。选择地势平坦、土层深厚、土质肥沃、通气良
"翻转课堂"是随着科技的进步,计算机的普及,网络的覆盖而发展起来的,并且极大方便了因故不能到课堂听讲的学生。但是,现在的"翻转课堂"教学模式仍然存在许多不到位的现象,本
为研究复合绝缘子老化性能的变化规律,选取河北省南部电网4支不同运行年限的复合绝缘子进行盐雾加速老化试验,分析试验过程中绝缘子表面放电、泄漏电流、憎水性能和分子结构
路面裂缝类病害是多数路面破损的早期形式,及时对裂缝进行检测并进行修补可以减少由于路面病害带来的损失。科学技术的不断发展使自动化路面病害检测取代人工现场调查成为了
通过对边坡位移历史数据序列进行特征分析 ,计算出饱和嵌入维数和最大 Lyapunov指数 ,给出了边坡位移的最大可预报时间尺度。在此基础上 ,确定了神经网络的输入节点数 ,建立
梁启超曾日“少年强则国强”,当代大学生作为中国未来活动的主体,他们的肩上承担着“中国梦”的责任。创造是人类进步的动力,对于当代大学生而言,没有创造性的学习,就不会有美好的
血管周上皮样细胞肿瘤(perivascular epithelioid cell tumours,PEComas)是由组织学和免疫组织化学上有独特表现的血管周上皮样细胞构成的间叶性肿瘤,PEComas家族包括肾血管