论文部分内容阅读
交通问题是目前城市发展中需要面临的一项重大问题,因此国家正在大力发展智慧城市,建设智能交通系统,以加快城市公交优化建设,提高大众交通信息服务能力。然而随着交通信息化的迅速发展,交通数据类型越来越繁多,数据量也日渐增大。而动态交通综合数据的分析和处理也面临着严峻的挑战。面对交通数据的多样性和复杂性,更加高效和稳定的数据组织管理方式才能有效地组织和管理不同类型的交通数据,同时,需要探索与研究数据的组织管理模型,思考现实交通数据问题的解决方案。即在数据的组织管理方面需要不断开拓时空数据模型研究,进一步提高数据存储与管理效率,注重海量数据的实时处理和深度挖掘,从而向社会和公众提供更加快速、准确、有效的交通信息服务以解决大众日常出行的公交慢、停车难、步行绕等问题。本文基于复杂多样的动态交通信息,围绕被动交通信息服务与主动交通信息搜索研究了信息检索的相关问题,并在探究中文地理分词方法的基础上研究了一种动态综合交通信息的数据模型并进行了应用探索。主要完成的工作有:(1)研究了中文地理分词方法,并在交通地理信息领域进行应用。为提高交通信息搜索时的服务响应速度,首先提出了交通专题信息快速切分方法;其次,实现了对RMM算法的改进,即实现了一种交通专题词优先的分词算法。该算法能够有效避免对专业词的歧义切分,结合结构优化的交通信息词典,能够提高对交通信息检索语句的分词精度。(2)面对上述算法的需要,并借鉴本体在语义表达上的层次特性设计了交通信息词典的存储结构,然后利用相关动态交通专题数据建立了交通专题信息词库。(3)基于本体方法建立动态交通信息综合数据模型。按照本体建模理论,并且结合地理本体的研究成果完成针对多专题动态交通信息的交通信息本体模型建立。(4)对模型的应用验证。以西城区TOCC系统为例,按照本体的模型结构将各种动态信息进行类别层次划分和关联整理。然后,利用分词算法对用户搜索语句做交通关键词提取,最终依据交通本体的推理查询,提供了对多类型动态交通信息的一体化搜索和多方位展示。结果表明,该模型对多源动态交通数据分析与检索具有一定的实际意义。研究成果也可以为动态交通信息处理提供技术参考。最后对基于本体知识的动态综合交通信息的进一步挖掘和应用进行了探索并做出展望。