决策树分类在交通数据分析系统中的应用研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:marsxwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能交通系统(ITS)已经成为21世纪交通运输体系的发展趋势,其实质是对交通信息的分析、共享和综合利用。数据挖掘,简单地说,就是从大量数据中提取或“挖掘”知识。分类分析是数据挖掘的一个重要组成部分,决策树分类又是分类分析中最为典型的方法。在交通数据分析中使用决策树分类技术,并学会一个分类模型,能够有效地利用海量交通数据进行交通状况的分析和预测。 交通拥塞是困扰城市交通的一种常见交通现象。在历史交通拥塞相关数据的基础上使用数据分类技术,能很大程度上去发现城市交通中的拥塞知识,从而做到对拥塞的估计和预防。发现交通拥塞知识首先必须学会交通拥塞分类模型,我们把这种分类模型称之为“交通拥塞分类器”。 基于以上理论,本文着重于分类算法及在此基础上建立的“交通拥塞分类器”的研究。在简要介绍了数据挖掘与分类技术的基本知识后,基于上海安装的交通数据采集分析系统SCATS采集的交通数据,本文首先分析了交通数据的特点并着重讨论了交通数据的预处理技术,在通常的只分析动态交通数据流属性的基础上增加了对城市道路本身的静态地理空间属性的分析。然后,讨论了急切分类决策树算法C4.5,针对C4.5算法构造分类模型时间开销较大,而且时效性较差的缺点,提出了一种基于懒散分类的改进算法:LDTA。该算法的思想是将懒散的基于示例的方法和C4.5分类方法有机的进行结合,从而可以充分发挥它们的优点,克服各自的缺点。这样就有效地提高了算法的时效性、运算速度,而又有较高的分类精确度。另外,本文从减少分类器分类复杂度、提升分类性能的角度出发,提出了构建“二层交通拥塞分类器”的思想,即分类器采用分别对静态地理空间属性和动态交通属性进行分类的分类器结构。实验表明,该分类器在对交通进行拥塞分类预测时达到了较好的效果。 最后,本文讨论了“交通数据分析和查询系统”,分析了其中使用的交通数据仓库模型以及系统的结构和功能,并就其中“二层交通拥塞分类器”的实际应用情况作了介绍。
其他文献
本文的主要研究目的是实现基于网络及OpenInventor的虚拟多机器人协同的仿真控制系统。该系统包括基于虚拟现实的多机器人可视化协同搬运子系统和立体视频传输子模块,能够完成
异构数据库集成是近年来数据库界的研究热点。本文主要对异构数据库集成系统的设计和实现做了系统全面的研究。提出了一种基于三层体系结构的异构数据库集成系统(HEDIS)。该
对低质量指纹图像进行高效的增强处理,以保证指纹细节特征的准确提取与比对,是指纹识别技术中很重要的一个方面。近几年随着指纹技术的发展,大量的指纹档案以图像文件的形式
保持结构性(Structure-Preserving, SP)签名与Groth-Sahai非交互式证明系统(简称GS证明系统)的结合,在密码学协议的模块化设计中有十分重要的作用,尤其在保护隐私的匿名性协
无线网络技术和流媒体应用技术是现今最流行、发展最迅猛的两项因特网技术,它们的出现为信息的传播与交流带来革命性的变化,也对人们的生活产生了深远的影响。随着3G时代的即
语言是人类所特有的也是最重要的交际手段,随着科技的发展,在现代社会,电话逐渐成为人们日常交流和感情沟通的重要手段,电话语音的识别研究也就相应变得越发重要起来。  电话语
在网络应用不断发展的今天,网络安全问题也日益突出,越来越多的安全技术被应用到网络安全领域。而大部分安全措施都属于被动防御,缺乏积极的保护措施。 入侵检测是网络安全体
网格是在计算机技术和网络技术发展到一定阶段提出的一种建立新型计算平台的计算技术,它要整合广域网中分布的,动态的,异构的资源,实现充分共享和各种资源之间广泛的协同工作
图像拼接是一个日益流行的研究领域,它已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般是通过对齐一系列空间重叠的图像,构造
随着现代企业制度的建立以及社会经济的高速发展,企业人力资源已成为左右企业生存发展的重要因素,加强人力资源的有效管理和运作已成为企业提高竞争力的重要手段。 作者在研究国内外人力资源管理系统发展和Web技术的基础上,提出了一个实用的人力资源管理系统结构以及绩效考核算法,采用Delphi 7开发了基于Web的人力资源管理系统(HRMS)。系统包括九个模块:人事信息管理、考勤管理、培训管理、休假管理