论文部分内容阅读
[摘 要]随着交通行业的快速发展,人们对数据仓库的管理以及数据分析的技术要求越来越高。为了提高公路的建设水平,需要对公路数据库建设过程中遇到的问题进行探讨,并对数据分析技术进行详细分析,希望本文内容对相关工作人员能够有所帮助。
[关键词]管理数据仓库;公路;数据分析
中图分类号:U495 文献标识码:A 文章编号:1009-914X(2015)45-0387-01
现代公路需要与信息社会相适应,这对公路管理提出了新要求,对管理数据仓库进行科学管理,从而对众多数据中的有效数据进行挖掘,使信息的潜在价值得到发挥,从而使公路的管理水平得到提高。但是,从实际情况来看,数据仓库技术有待解决。
一、管理仓库系统的最终目标
公路管理目标在运行过程中的主要目的是为了实现对公路的养护、管理以及费用的收缴等。目前,路面上出现的各种管理系统正在高速公路上被推行使用,要以推行的各种系统为基础完成管理数据仓库的建设,必须要提到系统目标问题。
公路管理数据仓库同一般的数据库相比存在很大差别,它的系统需求并不明确,存在一些带有方向的提问,这些提问将会与多个系统产生联系,在问题解决上不是一两个系统可以解决的,导致在系统开发的出现无法对系统的需求进行明确,因此在系统开发过程中,需要在了解开放目标的基础上对系统的需求进行不断的完善,这对这一状况,公路管理系统仓库对系统的目标进行明确定义:以已经覆盖的数据作为新系统建设的源数据库,然后在此基础上构建一个在应用过程中可以依据需求进行不断扩充、透明、共享的数据库,从而能够不断满足系统的需求。这样的目标并不是短时间内就能完成的,数据仓库的建设也不可能一步到位,因此要以明确的开发目标作为基础,一步一步攻克在系统开发过程中遇到的难题,从而实现最终的开发目的。
二、技术方案对比
为了使现代公路管理信息能够满足在应用过程中的需求,从而使公路管理过程中遇到的问题得到解决,在建设过程中需要找到一个合理的技术方案,方案的实施应当从数据管理与组织两个方面考虑:1、系统需要传统的数据库技术作为支撑。例如,通信费征管理系统、业务操作系统等。2、系统的开发和应用由数据仓库作为支撑。此外,伴随着信息技术在交通系统中应用的推广,近几年,在交通系统中,GIS理论的应用变得更加广泛,由 GIS所支撑的数据库也可将其称之为数据仓库。
数据库与数据仓库两者存在一定的差异,数据库在建模过程中使用的主要技术为E-R模式,其经常在业务处理中被应用,而公共管理业务多数都在关系数据模型的技术上所建立的信息管理系统。数据仓库建设中涉及到的管理技术与数据组成方法都是最新的,数据仓库所面向的主题是非易失的、集成的,主要用于对决策的支持,以及对决策的分析,也存在部分学者认为数据仓库并不一定必须要要有决策支持,其知识依据特定的结构而构成组成的用于对历史数据进行查询的数据集合。数据仓库与基于数据库理论的系统有着密切联系,但在数据组织和管理上存在的区别较大,主要体现在以下几个方面:
1、在数据仓库中对数据的管理和组织依据主题实现,驱动则以面向分析为准,传统的数据库则以数据理论为技术,主要面向业务操作,对业务流程的组织需要依据操作来实现,主要的处理都是在基于事务的基础上实现的。
2、数据仓库中的数据都是集成的,在数据的收集上,对涉及到的数据进行预处理,从而构成对决策分析有利的数据环境,传统的数据库则不同,数据的处理分散。
3、数据仓库为决策提供了良好的数据环境,为数据分析提供了多种级别的历史数据,传统的数据库更多的是面向操作,其目的是让数据库设计能够满足最小数据在查询和更改上的需求。因此,为了满足设计需求,需要许多小表,这利于操作性应用,但在数据分析时应为数据效果分析,从而将会导致决策支持的综合分析面临较大难度。此外,操作型系统在应用过程中通常只关注需要应用的数据,而会选择性的摒弃不需要的数据,这样在对问题进行分析时,数据的完整性将会受到影响,反映出现的问题也具有一定的片面性。
三、公路管理数据仓库数据挖掘系统的应用
(一)分析面向属性归纳
面向属性归纳法就是利用概念分层法对技术进行适当的提升,从而泛华属性概念,然后同归对知识的归纳实现对知识的收集。概念分层在操作上可以由用户、工程师、专家三方共同提供,在一些时候也可以有计算机自动生成。
(二)分析关联性
关联性分析技术对大量的数据进行分析,从而发现数据之间存在的关联性,在公路管理过程中,通过分析关联性可以发现一些关联的模式,例如公路在应用过程中路面损坏可能会与路基材料之间存在一定的关联,冲关车辆可能会与地域之间存在某种关联,依据统计分析结构可以制定出更加合理的技术方案和政策。
(三)趋势及预测分析
挖掘数据的最终目的使对公路的管理又被动逐渐转变我主动,因此公路管理需要具备一定的预测能力,其中最重要的是通过分析管理数据仓库中大量的历史数据,然后建立与公路管理类型、道路交通模型等相适应的模型。对历史数据进行挖掘,可以对已有模型提供参数支持,分析路面的历史数据,从而获取路面在应用过程中的衰变程度,使公路的管理水平得到提高。
(四)偏差分析
在公路管理过程中,可以通过偏差分析发现管理过程中出现的异常情况,对引起异常的原因进行及时分析,通过分析路政数据,从而发现异常现场。一些地区公路遭受的破坏严重,与历史同期或一般地区相比,出现偏差,针对这种偏差, 可以采取针对性分析,与相关部门进行协调,从而制定出合理的政策对遇到的问题加以解决。
(五)车辆报停欺诈中对数据挖掘技术的应用
现实问题要比设计的问题更加复杂,通过简单的数据挖掘很难对实际遇到的问题解决。目前,在数据挖掘案例中获取的成功更多是开发的专用的挖掘系统。因此,在对数据挖掘是需要对问题进行明确,并且要明确挖掘目标,从而选取最佳方法,针对不同领域建立适当的挖掘工具。
费用征收是公路管理中的核心业务,费用征收的合理运行是确保公路事业顺利开展的前提,费用征收十分复杂,因为车户的经济、社会的认知存在分歧,费用征收过程中经常会存在漏洞,费用征收部门需要加强自己的工作,确保费税的征收足额。在公路费用征收过程中对数据挖掘技术的应用,需要公路征收费用业务进行明确,理解不同阶段业务存在的问题,下面以养路费用为例,对存在的问题进行分析,分析过程中需要解决以下问题:
1、通过对违规车辆或车户进行分离,从而对公路征费的管理对象进行详细划分,通过有效的政策对征费问题进行宣传。
2、规则与特征的提取,在违规车辆和车户分类的提出过程中,需要理解行为的产生以及原因,对违规车辆的出现规律要进行详细分析,对多种行为要进行深入分析,从而制定出更好的稽查方案,确保征费的合理进行。
3、要具有一定的预测能力,对不同类型的车户在未来出现的欠费和报停欺诈问题、逃费总量等问题形势和任务要能够进行准确的预测。
四、结束语:
信息化的高速发展,使公路管路数据仓库得到了进一步发展,为现代公路管理联机分析以及决策分析提供了有力的工具支持,对现代公路的发展起到了一定的促进作用。
参考文献
[1] 张国芳. 高速公路联网收费数据多维分析系统研究[D].长安大学,201
[2] 黄智.数据仓库在我国高速公路运输量统计分析中的应用研究[D].长安大学,2012.
[关键词]管理数据仓库;公路;数据分析
中图分类号:U495 文献标识码:A 文章编号:1009-914X(2015)45-0387-01
现代公路需要与信息社会相适应,这对公路管理提出了新要求,对管理数据仓库进行科学管理,从而对众多数据中的有效数据进行挖掘,使信息的潜在价值得到发挥,从而使公路的管理水平得到提高。但是,从实际情况来看,数据仓库技术有待解决。
一、管理仓库系统的最终目标
公路管理目标在运行过程中的主要目的是为了实现对公路的养护、管理以及费用的收缴等。目前,路面上出现的各种管理系统正在高速公路上被推行使用,要以推行的各种系统为基础完成管理数据仓库的建设,必须要提到系统目标问题。
公路管理数据仓库同一般的数据库相比存在很大差别,它的系统需求并不明确,存在一些带有方向的提问,这些提问将会与多个系统产生联系,在问题解决上不是一两个系统可以解决的,导致在系统开发的出现无法对系统的需求进行明确,因此在系统开发过程中,需要在了解开放目标的基础上对系统的需求进行不断的完善,这对这一状况,公路管理系统仓库对系统的目标进行明确定义:以已经覆盖的数据作为新系统建设的源数据库,然后在此基础上构建一个在应用过程中可以依据需求进行不断扩充、透明、共享的数据库,从而能够不断满足系统的需求。这样的目标并不是短时间内就能完成的,数据仓库的建设也不可能一步到位,因此要以明确的开发目标作为基础,一步一步攻克在系统开发过程中遇到的难题,从而实现最终的开发目的。
二、技术方案对比
为了使现代公路管理信息能够满足在应用过程中的需求,从而使公路管理过程中遇到的问题得到解决,在建设过程中需要找到一个合理的技术方案,方案的实施应当从数据管理与组织两个方面考虑:1、系统需要传统的数据库技术作为支撑。例如,通信费征管理系统、业务操作系统等。2、系统的开发和应用由数据仓库作为支撑。此外,伴随着信息技术在交通系统中应用的推广,近几年,在交通系统中,GIS理论的应用变得更加广泛,由 GIS所支撑的数据库也可将其称之为数据仓库。
数据库与数据仓库两者存在一定的差异,数据库在建模过程中使用的主要技术为E-R模式,其经常在业务处理中被应用,而公共管理业务多数都在关系数据模型的技术上所建立的信息管理系统。数据仓库建设中涉及到的管理技术与数据组成方法都是最新的,数据仓库所面向的主题是非易失的、集成的,主要用于对决策的支持,以及对决策的分析,也存在部分学者认为数据仓库并不一定必须要要有决策支持,其知识依据特定的结构而构成组成的用于对历史数据进行查询的数据集合。数据仓库与基于数据库理论的系统有着密切联系,但在数据组织和管理上存在的区别较大,主要体现在以下几个方面:
1、在数据仓库中对数据的管理和组织依据主题实现,驱动则以面向分析为准,传统的数据库则以数据理论为技术,主要面向业务操作,对业务流程的组织需要依据操作来实现,主要的处理都是在基于事务的基础上实现的。
2、数据仓库中的数据都是集成的,在数据的收集上,对涉及到的数据进行预处理,从而构成对决策分析有利的数据环境,传统的数据库则不同,数据的处理分散。
3、数据仓库为决策提供了良好的数据环境,为数据分析提供了多种级别的历史数据,传统的数据库更多的是面向操作,其目的是让数据库设计能够满足最小数据在查询和更改上的需求。因此,为了满足设计需求,需要许多小表,这利于操作性应用,但在数据分析时应为数据效果分析,从而将会导致决策支持的综合分析面临较大难度。此外,操作型系统在应用过程中通常只关注需要应用的数据,而会选择性的摒弃不需要的数据,这样在对问题进行分析时,数据的完整性将会受到影响,反映出现的问题也具有一定的片面性。
三、公路管理数据仓库数据挖掘系统的应用
(一)分析面向属性归纳
面向属性归纳法就是利用概念分层法对技术进行适当的提升,从而泛华属性概念,然后同归对知识的归纳实现对知识的收集。概念分层在操作上可以由用户、工程师、专家三方共同提供,在一些时候也可以有计算机自动生成。
(二)分析关联性
关联性分析技术对大量的数据进行分析,从而发现数据之间存在的关联性,在公路管理过程中,通过分析关联性可以发现一些关联的模式,例如公路在应用过程中路面损坏可能会与路基材料之间存在一定的关联,冲关车辆可能会与地域之间存在某种关联,依据统计分析结构可以制定出更加合理的技术方案和政策。
(三)趋势及预测分析
挖掘数据的最终目的使对公路的管理又被动逐渐转变我主动,因此公路管理需要具备一定的预测能力,其中最重要的是通过分析管理数据仓库中大量的历史数据,然后建立与公路管理类型、道路交通模型等相适应的模型。对历史数据进行挖掘,可以对已有模型提供参数支持,分析路面的历史数据,从而获取路面在应用过程中的衰变程度,使公路的管理水平得到提高。
(四)偏差分析
在公路管理过程中,可以通过偏差分析发现管理过程中出现的异常情况,对引起异常的原因进行及时分析,通过分析路政数据,从而发现异常现场。一些地区公路遭受的破坏严重,与历史同期或一般地区相比,出现偏差,针对这种偏差, 可以采取针对性分析,与相关部门进行协调,从而制定出合理的政策对遇到的问题加以解决。
(五)车辆报停欺诈中对数据挖掘技术的应用
现实问题要比设计的问题更加复杂,通过简单的数据挖掘很难对实际遇到的问题解决。目前,在数据挖掘案例中获取的成功更多是开发的专用的挖掘系统。因此,在对数据挖掘是需要对问题进行明确,并且要明确挖掘目标,从而选取最佳方法,针对不同领域建立适当的挖掘工具。
费用征收是公路管理中的核心业务,费用征收的合理运行是确保公路事业顺利开展的前提,费用征收十分复杂,因为车户的经济、社会的认知存在分歧,费用征收过程中经常会存在漏洞,费用征收部门需要加强自己的工作,确保费税的征收足额。在公路费用征收过程中对数据挖掘技术的应用,需要公路征收费用业务进行明确,理解不同阶段业务存在的问题,下面以养路费用为例,对存在的问题进行分析,分析过程中需要解决以下问题:
1、通过对违规车辆或车户进行分离,从而对公路征费的管理对象进行详细划分,通过有效的政策对征费问题进行宣传。
2、规则与特征的提取,在违规车辆和车户分类的提出过程中,需要理解行为的产生以及原因,对违规车辆的出现规律要进行详细分析,对多种行为要进行深入分析,从而制定出更好的稽查方案,确保征费的合理进行。
3、要具有一定的预测能力,对不同类型的车户在未来出现的欠费和报停欺诈问题、逃费总量等问题形势和任务要能够进行准确的预测。
四、结束语:
信息化的高速发展,使公路管路数据仓库得到了进一步发展,为现代公路管理联机分析以及决策分析提供了有力的工具支持,对现代公路的发展起到了一定的促进作用。
参考文献
[1] 张国芳. 高速公路联网收费数据多维分析系统研究[D].长安大学,201
[2] 黄智.数据仓库在我国高速公路运输量统计分析中的应用研究[D].长安大学,2012.