基于本体框架的交通出行语义轨迹建模、标记及数据库研究

被引量 : 0次 | 上传用户:awards
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国城市化进程的加快导致个人活动空间迅速膨胀,出行作为城市居民的主要活动之一,不断挑战交通设施、能源消耗和环境承载力的极限。把握居民出行行为的特征及趋势是交通管理和空间规划的重要课题。全球定位系统(GPS)和现代通信技术的发展使大规模移动数据(轨迹)的实时获取变得简单易行,而海量出行轨迹数据的分析挖掘和管理应用成为现代交通服务的瓶颈。目前对轨迹数据的分析挖掘研究重点在于对轨迹本身的时态和空间分布特征的提取。由于缺乏与应用语义的关联,知识发现进展缓慢,所提取的模式也难以被特定领域专家所理解,具体应用开发方面裹足不前。海量轨迹处理和语义标注需要有理论基础和方法开发上较为显著的突破,才能走出目前的困境。本文尝试以地理本体论为基础,以GPS出行轨迹为研究对象,探讨集成语义和时空信息进行轨迹综合分析的方案,从理论上构建集成时空和语义信息的轨迹本体框架;从方法上提供语义轨迹本体构建、标记、存储和查询过程的设计与实施方案;从实践上探讨了与轨迹分析相关领域的应用,为交通管理和空间规划提供借鉴与参考。主要研究内容和结论如下:第一章分析了本研究的背景和意义,并对国内外地理本体相关研究进展进行评述。按照研究领域不同,将现有的地理本体划分为三类:地理领域本体、地理空间本体和地理时空本体,并就本文的研究重点地理时空本体进行了详细回顾。认为现有时空本体包括通用时空本体和领域时空本体两类,通用时空本体注重分类、层次框架研究,缺乏与应用领域的关联,而领域时空本体注重应用领域的需求,但缺乏理论的指导,存在表达上和扩展上的缺陷。因此,本文选择使用“通用时空本体作为顶层本体、领域时空本体作为领域本体”作为方案构建语义轨迹本体。另外,基于目前多数地理本体研究仅关注模型构建,而缺乏具体实现的现状,本文将本体构建后的后续实现也作为重要研究内容之一。第二章主要探讨语义轨迹本体的构建设计。首先,引入SNAP-SPAN通用时空本体框架SNAP-SPAN作为顶层本体,并在对框架主要内容总结的基础上,抽象出面向本文轨迹分析中存在的类及类关系。其次,探讨顶层本体中空间、时态和领域信息的表达及集成,针对本体技术仅支持二元关系表达的现状,对现有时态信息的本体表达的各种方案进行了对比研究,认为4D函数模型是最为适合本文的时态表达模型。再次,使用模块化的方式建立领域本体,包括通用轨迹本体、地理领域本体和应用本体三个部分,并分别探讨了各部分的具体内容。最后,以个人和出租车出行为目标应用,建立了相关的语义轨迹本体。结果表明,顶层本体的引入,可以清晰表达所涉及类之间的区别(持久对象和持续对象)和联系(空间、时态、语义上下文关系关联),也可以统一对时态和空间对象及关系进行抽象,再此基础上具体化得到的领域本体,更具有可扩展性和共享性;选用模块化的方式进行本体表达可以提升各部分本体的独立性和重用性。第三章探讨语义轨迹的标记过程。首先,根据上一章建立的个人和出租车出行语义轨迹本体,归纳出这两种典型轨迹的一般语义标记过程。认为个人出行语义关注活动,标记过程围绕活动信息展开,其内容为“数据清理→行程分割→行程方式划分→行程目的提取”,而出租车出行关注移动,标记过程为“行程段分割→数据清理→地图匹配→路径分割→速度分割”。其次,根据上述过程进行了算法和方案设计。其中,个人出行方面,针对行程分割过程,本文提出了T-DBSCAN算法,提高了行程分割的正确率和计算速度,另外,针对轨迹相关信息自动提取正确率低的现状,本文设计并开发了“GPS出行调查地理提示交互系统平台”,保证了对轨迹语义的获取;出租车出行方面,针对本文“离线、采样率低和道路数据不完整”数据特征,设计了相应的地图匹配算法,并且探讨了将其转换为语义轨迹的后处理过程。第四章讨论语义轨迹本体的数据库存储方案设计和实施。首先,对现有的四种本体数据库存储方式进行对比研究,由于垂直模式不但具有表结构简单和本体更新操作容易、且受语义软件广泛支持,因此,以此作为本文模式存储的基础,对语义轨迹本体进行模块化存储。选择ORACLE11g作为语义数据库设计的平台,针对轨迹数据的特点对其资源描述部分进行了时空拓展,并探讨了关系数据库对本体数据库的实例数据映射方案;最后,对本体数据库进行了索引操作。第五章以个人和出租车出行为例,在Oracle语义查询技术框架下进行了语义轨迹查询实证分析。结果表明,本体在对语义信息的表达和操作上具有很强的优势,而在面向轨迹数据查询中,时空和路径序列的信息提取也非常重要,但语义查询技术对该方面的支持略显不足。为此,本文设计了基于Jena Adapter的轨迹时空及路径查询的扩展方案;最后进行了相关的实例分析。结果表明:拓展后的查询能够较好地发挥定量分析和定性查询的各自优势;从语义角度对出行路径进行匹配的方案具有较高的可执行性。
其他文献
为提高物流管理绩效,促进回收处理行业健康发展,结合废旧家电回收处理流程,分析了废旧家电回收物流网络的产品收集、检测/分类、仓储、再处理、再分销、废弃处置等一般功能需
目的了解临沂市24家医院的用药安全现状及城乡用药安全差异。方法采用雷达图分析法对临沂市24家医院的医院用药安全自评表中关于用药安全的10项关键元素进行分析、评价。结果
农民工已经成为我国经济社会转型时期推进城市发展的一支重要力量,其医疗保障问题的解决关系到社会主义和谐社会的构建。目前农民工医疗保障体总体状况不容乐观,尚存在制度保
伴随桉树人工林的不断迅速发展给社会带来良好经济效益的同时,由于不合理的经营措施也带来了一系列的生态问题。引发了学术界的争论并且愈演愈烈,争论的焦点主要是:(1)桉树人
目的:系统评价中药内服治疗妊娠剧吐的临床疗效及安全性。方法:全面检索中药内服治疗妊娠剧吐的随机对照试验文献并进行系统评价,根据Cochane协作网提供的偏倚风险评价工具评
1987年《中华人民共和国村民委员会组织法(试行)》开始颁布实施,若以此为开端,村民自治在我国实施已有24年。作为国家法定的政治制度,村民自治最大的特点就是它内生于我国草
房地产业是指从事房地产开发、经营、管理和服务的产业。它是国民经济的基本承载体,是在工业化、城市化和现代化过程中兴起、发展所形成的独立产业,同时又推动了工业化、城市
后工业社会的转型和发展,让居民的消费条件得到了大大改善和提高,全新的后现代消费理念也就孕育而生。伴随着度假旅游热潮在全球范围内的不断升温,近年来入住高档度假酒店进
笔者在学习相关知识的基础上,把婚恋网站作为研究对象,以我国发展迅速的婚恋网站“世纪佳缘”为例,从传播学、新闻学、经济学、社会学、心理学等角度探讨了婚恋网站的发展背
反思北京孕妇死亡事件,分析医患者之间的关系,从伦理、法律和社会学角度探讨发生该悲剧的原因。该事件医患关系的法律属性属于民事法律关系,法律不可以授权医务人员强制治疗