论文部分内容阅读
无论是日常生活工作还是休闲娱乐,人们的生活总离不开交通出行。随着全球人口数量的不断增长,与时俱进的交通设施、交通工具仍旧赶不上越来越多的交通出行量,交通问题可谓是一个世界性的难题。智能交通系统在全球范围内的应用遇到了一些瓶颈,而跟随物联网衍生出的智慧交通在智能交通系统的基础上更上一层楼,给解决交通问题带来了新的希望。方兴未艾的智慧交通在解决交通问题的同时也带来了更加繁复海量的交通数据,如何从这些大数据中汲取对交通管理有利的信息,成为一个亟待解决的问题。围绕上述问题,本文采用数据挖掘技术和分布并行的Hadoop技术的融合,设计出智慧交通运行状态数据分析系统的架构并分析研究适合该系统的挖掘算法,以实际交通大数据的实验证明智慧交通运行状态数据分析系统的可行性,旨在为交通状态提供决策性意见。本文对比分析了智慧交通系统各个层面的技术与信息特点,给出了包含数据采集层、网络传输层、数据分析处理层和应用层的智慧交通系统框架。在数据分析处理层面上,针对交通信息的数据特点,基于数据挖掘典型系统,研究了利用分布式并行新技术Hadoop技术来实现交通数据挖掘分析,并提出了智慧交通运行状态数据分析系统架构。继而对传统数据挖掘算法进行改进,分析了智慧交通运行状态数据分析系统的软件算法。利用部署的Hadoop服务器群集,采用MapReduce编程模型的改进Apriori算法,实例运行了交通大数据,进行了车流量分析和车速超速分析,并从中挖掘出有利交通管控的信息。证明了利用Hadoop平台挖掘交通海量信息的可行性和有效性。本文最后总结了实例算法超速分析的可改进点,并对智慧交通运行状态数据分析系统进行了展望,相信分布式并行的智慧交通运行状态数据分析系统在未来一定会对智慧交通作出贡献。