论文部分内容阅读
中国城市化进程的加快导致个人活动空间迅速膨胀,出行作为城市居民的主要活动之一,不断挑战交通设施、能源消耗和环境承载力的极限。把握居民出行行为的特征及趋势是交通管理和空间规划的重要课题。全球定位系统(GPS)和现代通信技术的发展使大规模移动数据(轨迹)的实时获取变得简单易行,而海量出行轨迹数据的分析挖掘和管理应用成为现代交通服务的瓶颈。目前对轨迹数据的分析挖掘研究重点在于对轨迹本身的时态和空间分布特征的提取。由于缺乏与应用语义的关联,知识发现进展缓慢,所提取的模式也难以被特定领域专家所理解,具体应用开发方面裹足不前。海量轨迹处理和语义标注需要有理论基础和方法开发上较为显著的突破,才能走出目前的困境。本文尝试以地理本体论为基础,以GPS出行轨迹为研究对象,探讨集成语义和时空信息进行轨迹综合分析的方案,从理论上构建集成时空和语义信息的轨迹本体框架;从方法上提供语义轨迹本体构建、标记、存储和查询过程的设计与实施方案;从实践上探讨了与轨迹分析相关领域的应用,为交通管理和空间规划提供借鉴与参考。主要研究内容和结论如下:第一章分析了本研究的背景和意义,并对国内外地理本体相关研究进展进行评述。按照研究领域不同,将现有的地理本体划分为三类:地理领域本体、地理空间本体和地理时空本体,并就本文的研究重点地理时空本体进行了详细回顾。认为现有时空本体包括通用时空本体和领域时空本体两类,通用时空本体注重分类、层次框架研究,缺乏与应用领域的关联,而领域时空本体注重应用领域的需求,但缺乏理论的指导,存在表达上和扩展上的缺陷。因此,本文选择使用“通用时空本体作为顶层本体、领域时空本体作为领域本体”作为方案构建语义轨迹本体。另外,基于目前多数地理本体研究仅关注模型构建,而缺乏具体实现的现状,本文将本体构建后的后续实现也作为重要研究内容之一。第二章主要探讨语义轨迹本体的构建设计。首先,引入SNAP-SPAN通用时空本体框架SNAP-SPAN作为顶层本体,并在对框架主要内容总结的基础上,抽象出面向本文轨迹分析中存在的类及类关系。其次,探讨顶层本体中空间、时态和领域信息的表达及集成,针对本体技术仅支持二元关系表达的现状,对现有时态信息的本体表达的各种方案进行了对比研究,认为4D函数模型是最为适合本文的时态表达模型。再次,使用模块化的方式建立领域本体,包括通用轨迹本体、地理领域本体和应用本体三个部分,并分别探讨了各部分的具体内容。最后,以个人和出租车出行为目标应用,建立了相关的语义轨迹本体。结果表明,顶层本体的引入,可以清晰表达所涉及类之间的区别(持久对象和持续对象)和联系(空间、时态、语义上下文关系关联),也可以统一对时态和空间对象及关系进行抽象,再此基础上具体化得到的领域本体,更具有可扩展性和共享性;选用模块化的方式进行本体表达可以提升各部分本体的独立性和重用性。第三章探讨语义轨迹的标记过程。首先,根据上一章建立的个人和出租车出行语义轨迹本体,归纳出这两种典型轨迹的一般语义标记过程。认为个人出行语义关注活动,标记过程围绕活动信息展开,其内容为“数据清理→行程分割→行程方式划分→行程目的提取”,而出租车出行关注移动,标记过程为“行程段分割→数据清理→地图匹配→路径分割→速度分割”。其次,根据上述过程进行了算法和方案设计。其中,个人出行方面,针对行程分割过程,本文提出了T-DBSCAN算法,提高了行程分割的正确率和计算速度,另外,针对轨迹相关信息自动提取正确率低的现状,本文设计并开发了“GPS出行调查地理提示交互系统平台”,保证了对轨迹语义的获取;出租车出行方面,针对本文“离线、采样率低和道路数据不完整”数据特征,设计了相应的地图匹配算法,并且探讨了将其转换为语义轨迹的后处理过程。第四章讨论语义轨迹本体的数据库存储方案设计和实施。首先,对现有的四种本体数据库存储方式进行对比研究,由于垂直模式不但具有表结构简单和本体更新操作容易、且受语义软件广泛支持,因此,以此作为本文模式存储的基础,对语义轨迹本体进行模块化存储。选择ORACLE11g作为语义数据库设计的平台,针对轨迹数据的特点对其资源描述部分进行了时空拓展,并探讨了关系数据库对本体数据库的实例数据映射方案;最后,对本体数据库进行了索引操作。第五章以个人和出租车出行为例,在Oracle语义查询技术框架下进行了语义轨迹查询实证分析。结果表明,本体在对语义信息的表达和操作上具有很强的优势,而在面向轨迹数据查询中,时空和路径序列的信息提取也非常重要,但语义查询技术对该方面的支持略显不足。为此,本文设计了基于Jena Adapter的轨迹时空及路径查询的扩展方案;最后进行了相关的实例分析。结果表明:拓展后的查询能够较好地发挥定量分析和定性查询的各自优势;从语义角度对出行路径进行匹配的方案具有较高的可执行性。