论文部分内容阅读
摘 要: 针对目前消防接处警系统中海量数据统计分析进而高效决策的问题,将统计软件SPSS引入到消防接处警数据的分析中,首先采用SPSS中的相关分析工具对样本数据进行Person相关系数的分析,然后采用判定树分析工具对样本数据进行CHAID判定树的生成,实验结果表明,SPSS能有效挖掘出接处警数据间的潜在关系,为合理规划消防抢险救援中的警力分配提供决策支持。
关键词: SPSS;消防;接处警;相关分析;判定树
中图分类号:X924.3 文献标识码:A 文章编号:1671-7597(2011)1220136-02
1 SPSS软件概述
SPSS是社会科学统计软件包(Statistical Package for the Social Science)的简称,与SAS、BMDP并称为国际上最具有影响力的三大统计软件[1]。SPSS拥有数据管理、统计分析、图表分析、输出管理等多项基本功能,可以进行多类统计分析,目前已广泛被应用于生物学、教育学、心理学、医疗卫生等领域。
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮[2]。SPSS软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又包含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。
2 消防接处警系统
近两年国内大部分城市实行接警“三台合一”,即将110、119和交巡警指挥中心三个指挥平台合并成一个指挥平台,从而成为应急联动中心。消防部队普遍使用“接处警管理系统”,积累了大量消防接警、调度、处警等数据信息,为使用SPSS软件在该消防领域的应用研究打下了数据基础[3]。
因为消防接处警系统贯穿消防值班和灭火作战等各个环节,具有覆盖范围广、流程复杂、各环节联系紧密的特点,在消防通信指挥系统中有着极其重要的地位[4]。消防接处警的基本工作流程是:当119电话报警或“城市火灾自动报警系统”中前端探测器传来火警报警地点和火灾地点周边地图、建筑物平面图及火灾单位概况等相关信息,同时接警员将报警人口述基本情况进行录入,系统会根据各动态显示的消防中队实力情况和火场情况及灭火救援预案生成出动方案,以辅助接警员决策。接警员综合分析判断后对相应中队下达出动命令,同时将有关信息发送出去,位于各个消防中队值班室的火警终端台接收指挥中心的出警命令和有关信息后进行出警处理,包括警情广播地图及相关信息打印、车库开启、人员车辆出动等。
3 SPSS用于分析接处警数据
3.1 数据预处理
一次完整的消防接处警包括接警、消防力量调度、灾害事故处置等三个阶段[5]。对于该过程,抽象出来可以进行描述的属性包括直接财产损失、灾害事故处置时间、出动的消防车辆数量、是否跨区域作战以及灾害事故等级。
本文以某市某区2011年上半年1514条接处警数据为分析样本,在PASW18.0平台下进行实验。对接处警数据分析之前,首先需要将输入的样本数据进行标准化处理。在抽象出的上述属性中,各属性的单位不同,例如直接财产损失度量单位为万元,灾害事故处置时间度量单位为小时等,因此对各属性进行标准化处理就显得尤为重要。数据标准化的主要功能就是消除属性间的量纲关系,从而使数据具有可比性。本文使用SPSS自带的数据标准化工具对数据进行了预处理,处理结果如表1所示。
3.2 关联分析
关联规则旨在从大型数据库中找出新颖的、有趣的、具有可行性和指导性的不同数据项之间的关系[6]。关联分析的目的是发现特征之间或数据之间的相互依赖关系,如果从一个元素A的值可以推出另一个元素B的值(A→B),则称B依赖于A。本文利用SPSS软件的相关分析工具,计算Person相关系数,结果如图1所示。
由图1可以看出,火灾事故等级与直接财产损失高度相关,Person相关系数为1.0,与事故处置时间中度相关,Person相关系数为0.765,与出动的消防车辆数及跨区域联合作战低度相关。同时可以看出,出动的消防车辆数与跨区域联合作战高度相关。
3.3 判定树分析
判定树也称为决策树,在数据挖掘中判定树一般用来产生分类规则,解决分类问题。判定树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点代表类或类分布[7]。本文利用SPSS软件的Classification Tree分析工具,以属性“火灾事故等级”作为Dependent Variable,采用CHAID方法生成判定树,结果如图2所示:
由图2可以看出,火灾事故等级可以准确判定直接财产损失的多少:若火灾事故等级为特大火灾,则直接财产损失为5000万元以上,符合判定的数据条数为630条;若火灾事故等级为重大火灾,则直接财产损失在5000万元与1000万元之间,符合判定的数据条数为546条;若火灾事故等级为一般火灾,则直接财产损失为1000万元以下,符合判定的数据条数为338条。除此之外,事故处置时间、出动的消防车辆数及跨区域联合作战等属性均不能由火灾事故等级判定出来。
4 结论
目前,消防接处警系统存在的主要问题是大量的接处警数据仍处在“数据丰富,但信息贫乏”的状况,如何从这些海量的数据中找出有价值的知识和规则,已成为一个非常有挑战性的研究课题。SPSS在数据统计分析方面的独特优势正好可以弥补接处警系统中存在的上述不足。本文运用SPSS的相关分析、判定树分析等分析功能,从海量的消防接处警数据中挖掘出了有价值的信息,实验结果符合《生产安全事故报告和调查处理条例》(国务院令第493号)中对于火灾事故等级的分类标准,具有一定的实际应用价值。
参考文献:
[1]张兰芳,用SPSS统计软件对学生综合成绩的因子分析[J].教育技术导论,2007(12):44-45.
[2]陈朋,基于SPSS和KNIME的K-means聚类结果研究[J].微型机与应用,2010(12):1-3.
[3]董法军、马雯,关联规则在消防接处警数据分析中的应用[J].武警学院学报,2008,24(10):87-89.
[4]陈建安、陈宏盛、吴秋云,基于.NET平台的消防接处警系统的设计与实现[J].计算机工程,2005,31(4):215-223.
[5]董法军、马雯,相关分析在消防接处警数据中的应用研究[J].消防科学与技术,2010,29(4):314-317.
[6]张斌、张晶、史丽君、胡学钢,正相关性指导下的关联规则剪纸算法[J].计算机工程,2011,37(19):1-4.
[7]Jiawei Han、Micheline Kmber,数据挖掘概念与技术[M].北京:机械工业出版社,2004:188-196.
作者简介:
宋玉华(1981-),男,山东烟台公安消防支队助理工程师,主要从事火灾信息处理及人工智能方面的研究。
关键词: SPSS;消防;接处警;相关分析;判定树
中图分类号:X924.3 文献标识码:A 文章编号:1671-7597(2011)1220136-02
1 SPSS软件概述
SPSS是社会科学统计软件包(Statistical Package for the Social Science)的简称,与SAS、BMDP并称为国际上最具有影响力的三大统计软件[1]。SPSS拥有数据管理、统计分析、图表分析、输出管理等多项基本功能,可以进行多类统计分析,目前已广泛被应用于生物学、教育学、心理学、医疗卫生等领域。
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮[2]。SPSS软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又包含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。
2 消防接处警系统
近两年国内大部分城市实行接警“三台合一”,即将110、119和交巡警指挥中心三个指挥平台合并成一个指挥平台,从而成为应急联动中心。消防部队普遍使用“接处警管理系统”,积累了大量消防接警、调度、处警等数据信息,为使用SPSS软件在该消防领域的应用研究打下了数据基础[3]。
因为消防接处警系统贯穿消防值班和灭火作战等各个环节,具有覆盖范围广、流程复杂、各环节联系紧密的特点,在消防通信指挥系统中有着极其重要的地位[4]。消防接处警的基本工作流程是:当119电话报警或“城市火灾自动报警系统”中前端探测器传来火警报警地点和火灾地点周边地图、建筑物平面图及火灾单位概况等相关信息,同时接警员将报警人口述基本情况进行录入,系统会根据各动态显示的消防中队实力情况和火场情况及灭火救援预案生成出动方案,以辅助接警员决策。接警员综合分析判断后对相应中队下达出动命令,同时将有关信息发送出去,位于各个消防中队值班室的火警终端台接收指挥中心的出警命令和有关信息后进行出警处理,包括警情广播地图及相关信息打印、车库开启、人员车辆出动等。
3 SPSS用于分析接处警数据
3.1 数据预处理
一次完整的消防接处警包括接警、消防力量调度、灾害事故处置等三个阶段[5]。对于该过程,抽象出来可以进行描述的属性包括直接财产损失、灾害事故处置时间、出动的消防车辆数量、是否跨区域作战以及灾害事故等级。
本文以某市某区2011年上半年1514条接处警数据为分析样本,在PASW18.0平台下进行实验。对接处警数据分析之前,首先需要将输入的样本数据进行标准化处理。在抽象出的上述属性中,各属性的单位不同,例如直接财产损失度量单位为万元,灾害事故处置时间度量单位为小时等,因此对各属性进行标准化处理就显得尤为重要。数据标准化的主要功能就是消除属性间的量纲关系,从而使数据具有可比性。本文使用SPSS自带的数据标准化工具对数据进行了预处理,处理结果如表1所示。
3.2 关联分析
关联规则旨在从大型数据库中找出新颖的、有趣的、具有可行性和指导性的不同数据项之间的关系[6]。关联分析的目的是发现特征之间或数据之间的相互依赖关系,如果从一个元素A的值可以推出另一个元素B的值(A→B),则称B依赖于A。本文利用SPSS软件的相关分析工具,计算Person相关系数,结果如图1所示。
由图1可以看出,火灾事故等级与直接财产损失高度相关,Person相关系数为1.0,与事故处置时间中度相关,Person相关系数为0.765,与出动的消防车辆数及跨区域联合作战低度相关。同时可以看出,出动的消防车辆数与跨区域联合作战高度相关。
3.3 判定树分析
判定树也称为决策树,在数据挖掘中判定树一般用来产生分类规则,解决分类问题。判定树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点代表类或类分布[7]。本文利用SPSS软件的Classification Tree分析工具,以属性“火灾事故等级”作为Dependent Variable,采用CHAID方法生成判定树,结果如图2所示:
由图2可以看出,火灾事故等级可以准确判定直接财产损失的多少:若火灾事故等级为特大火灾,则直接财产损失为5000万元以上,符合判定的数据条数为630条;若火灾事故等级为重大火灾,则直接财产损失在5000万元与1000万元之间,符合判定的数据条数为546条;若火灾事故等级为一般火灾,则直接财产损失为1000万元以下,符合判定的数据条数为338条。除此之外,事故处置时间、出动的消防车辆数及跨区域联合作战等属性均不能由火灾事故等级判定出来。
4 结论
目前,消防接处警系统存在的主要问题是大量的接处警数据仍处在“数据丰富,但信息贫乏”的状况,如何从这些海量的数据中找出有价值的知识和规则,已成为一个非常有挑战性的研究课题。SPSS在数据统计分析方面的独特优势正好可以弥补接处警系统中存在的上述不足。本文运用SPSS的相关分析、判定树分析等分析功能,从海量的消防接处警数据中挖掘出了有价值的信息,实验结果符合《生产安全事故报告和调查处理条例》(国务院令第493号)中对于火灾事故等级的分类标准,具有一定的实际应用价值。
参考文献:
[1]张兰芳,用SPSS统计软件对学生综合成绩的因子分析[J].教育技术导论,2007(12):44-45.
[2]陈朋,基于SPSS和KNIME的K-means聚类结果研究[J].微型机与应用,2010(12):1-3.
[3]董法军、马雯,关联规则在消防接处警数据分析中的应用[J].武警学院学报,2008,24(10):87-89.
[4]陈建安、陈宏盛、吴秋云,基于.NET平台的消防接处警系统的设计与实现[J].计算机工程,2005,31(4):215-223.
[5]董法军、马雯,相关分析在消防接处警数据中的应用研究[J].消防科学与技术,2010,29(4):314-317.
[6]张斌、张晶、史丽君、胡学钢,正相关性指导下的关联规则剪纸算法[J].计算机工程,2011,37(19):1-4.
[7]Jiawei Han、Micheline Kmber,数据挖掘概念与技术[M].北京:机械工业出版社,2004:188-196.
作者简介:
宋玉华(1981-),男,山东烟台公安消防支队助理工程师,主要从事火灾信息处理及人工智能方面的研究。