论文部分内容阅读
数据挖掘技术就是通过对现实问题进行有效的模式提取,从大量的数据中发现隐藏于其后的规律或数据间的关系,从而分析、提取出有用的知识,服务于管理决策。
目前解决交通问题的主要手段是通过对交通流数据进行分析,从而找到交通问题的症结所在,进而着手解决。但是随着交通参与者规模的不断扩大,交通流数据也呈指数级增长,大规模、海量的交通数据处理从计算能力和分析深度上提出了新的要求。传统的基于统计的交通分析过程不能发现交通流数据中隐藏的知识和信息,而数据挖掘技术可以帮助我们快速、准确的得到所需要的信息。
本文介绍了数据挖掘的背景知识,论述了交通流数据分析的目的和意义。文中对所用关键技术(聚类技术和关联规则技术)进行了详细介绍,给出了二者的基本概念和典型算法,并对系统中所采用的K-means算法及Apriori算法进行了详细分析。通过对主流数据挖掘软件及其商业标准进行学习和研究进而确定SimpleDM系统的需求。利用软件工程中瀑布式开发模型,设计并实现了SimpleDM系统。通过对常见的学生成绩进行挖掘来验证系统的正确性,最后提出了该系统在交通流数据分析中的潜在应用。即:(1)通过聚类分析推断出日期与某尾号车辆出行情况的规律。(2)通过关联规则分析可以得到出一个或多个尾号车辆出行情况对另外一个或多个尾号车辆出行情况的影响。