论文部分内容阅读
摘 要: 森林作为陆地上重要的生态系统,具有环境与资源双重属性。一旦发生火灾,将对环境和大气造成无法弥补的破坏。数据挖掘技术在森林防火中具有重要的的作用,能够对森林火灾进行预测,从而达到预防的效果。
关键词: 森林火灾;数据挖掘;应用研究
【中图分类号】 TP311.4 【文献标识码】 A【文章编号】 2236-1879(2018)14-0027-01
一、研究背景及意义
森林是极其珍贵的自然资源,在净化空气、调节气候等方面具有巨大的功能,对维持人类生活环境方面发挥着关键作用,且还是珍贵的野生动物的栖息地。一旦发生火灾,将对环境和大气造成毁灭性的、无法弥补的破坏(大气中30%的二氧化碳来自森林火灾),甚至造成重大人身事故和巨大的财产损失。破坏森林资源的自然灾害除了火灾,还有病灾和虫灾,但是火灾是破坏性和危害性最大的。
森林作为陆地上重要的生态系统,具有环境与资源双重属性,它提供了丰富多彩的资源产品,营造了优美的环境,维持着地球的生态平衡。火灾的发生,不但会造成巨大的经济损失和人员的伤亡,而且对整个大气的污染是巨大的,将持续影响人们的健康生活。因此,对火灾发生规律进行预测并对潜在危险区进行监测,及早发现火灾,可以大大縮短反应时间,减少火灾潜在损失和灭火成本。“预防为主,积极消灭”是我国森林防火方针。如何从大量的历史森林火灾数据中挖掘出有用的知识以供决策者参考是现在急需解决的问题。
二、数据挖掘技术在森林火灾中应用研究
数据挖掘是一个融合了多项技术的研究范畴,它集成了数据库技术、机器学习、人工智能、统计学、知识库系统、信息检索等最近技术的研究成果。还有许多与其相近的术语,如从数据库中发现知识(Knowledge Discovery in Database, KDD)、数据分析(Date Analysis)、数据融合(Data Fusion)以及决策支持等。2001年,Gartner Group在一次高级技术调查中将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关键技术”之首,还将并行处理体系和数据挖掘列为未来的五年内投资焦点的十大新兴科技前两位[1]。
20世纪80年代末开始出现了发现知识(KDD)一词,在1989年8月美国底特律市举办了第一届KDD国际学术会议上第一次提到了该词的概念。起初每两年举办一次KDD 会议,到1993年后一年举办一次。直到1995年加拿大的蒙特利尔举办了首届KDD &Data Mining的国际会议,才开始流行知识发现和数据挖掘。之后,在国外有关数据挖掘相关的论文发表得十分多,并形成了比较热门的研究方向,比较集中发表的论文期刊如:《Data Mining and Knowledge Discovery》、《Artificial Intelligence Review》[1]。
在国内,1993年中科院合肥分院获得我国自然科学基金首次在数据挖掘领域的研究的支持。通过检索被科学引文数据库(SCI)、工程索引数据(EI)和清华全文期刊数据库(CNKI)收录有关数据挖掘方面的文章,可知:1997年中国有关数据挖掘的文章在SCI收录了2篇,CNKI中收录了3篇,这说明在数据挖掘方向的研究,中国与国外在时间上相差不大。国内有关数据挖掘论文的发表也逐年增加,说明中国的数据挖掘研究也正在加强[1]。
数据挖掘是面向实际应用的技术。现已广泛地应用在金融、电信、保险、农业、制造业、医疗卫生等领域,数据挖掘在农林火灾中的应用研究也引起了国内外专家学者的关注。
Tao Cheng等探讨了时空数据挖掘在森林防火中的应用,特别关注森林火灾的时空预测,提出了一种集成时空预测ISTFF框架:使用一个动态递归神经网络的空间预测,然后以加拿大森林火险区预测为例,与其他方法做了比较。Paulo Cortez等探索了数据挖掘方法来预测森林火灾的燃烧面积,在基于最近葡萄牙东北部收集的真实数据,测试了五种不同的DM技术(如支持向量机(SVM)和随机森林)和四种不同的特征选择设置(使用空间、时间、火灾森林指数(FWI)和天气属性)。最好的配置是使用了一个支持向量机(SVM)和四个气象输入(即温度、相对湿度、雨、风),它能预测更加频繁小火的燃烧面积。这对提高消防管理尤其有用。
刘芳[2]针对K均值中容易出现局部最优的缺点,引入了蚁群算法ICACA对其进行优化,提出一种改良的蚁群聚类算法,利用实验对比,新的算法能够在时间上和聚类的准确性上获得一个平衡,然后运用在预测分析实际的森林火灾中。苏成伟[3]将模拟退火算法与遗传算法结合起来,形成了模拟退火遗传算法,将该算法应用于关联规则的挖掘中,然后在森林火灾数据中应用改良的算法。印世乐针对传统的遗传算法容易陷入局部最优和早熟的缺点,提出了一种改进的多种群遗传算法,然后将算法应用于森林火灾数据进行关联规则挖掘。王轩为了能够实时监控林中的温度、相对湿度等火灾因子,运用ZigBee无线传感器网络、Internet网络、GPRS数据通信等技术构建了基于物联网技术的远程监测系统。许志卿在研究中运用半正规规划建模方法,建立了自定义核函数的SVM模型,对比了线性核函数的模型、基于自定义核函数的SVM模型和基于高斯核函数SVM模型三种林火预测模型的预测效果,设计并实现了基于这三种模型的林火预测系统。
参考文献
[1] 李菁菁,邵培基,黄亦潇.数据挖掘在中国的现状和发展研究[J].管理工程学报,2004(03):10-15.
[2] 刘芳.改进的蚁群聚类算法在森林火灾预测中的应用研究:[硕士学位论文].阜新:辽宁工程技术大学,2009.
[3] 苏成伟.一种改进的遗传算法在数据挖掘中的应用研究:[硕士学位论文].合肥:合肥工业大学,2013.
关键词: 森林火灾;数据挖掘;应用研究
【中图分类号】 TP311.4 【文献标识码】 A【文章编号】 2236-1879(2018)14-0027-01
一、研究背景及意义
森林是极其珍贵的自然资源,在净化空气、调节气候等方面具有巨大的功能,对维持人类生活环境方面发挥着关键作用,且还是珍贵的野生动物的栖息地。一旦发生火灾,将对环境和大气造成毁灭性的、无法弥补的破坏(大气中30%的二氧化碳来自森林火灾),甚至造成重大人身事故和巨大的财产损失。破坏森林资源的自然灾害除了火灾,还有病灾和虫灾,但是火灾是破坏性和危害性最大的。
森林作为陆地上重要的生态系统,具有环境与资源双重属性,它提供了丰富多彩的资源产品,营造了优美的环境,维持着地球的生态平衡。火灾的发生,不但会造成巨大的经济损失和人员的伤亡,而且对整个大气的污染是巨大的,将持续影响人们的健康生活。因此,对火灾发生规律进行预测并对潜在危险区进行监测,及早发现火灾,可以大大縮短反应时间,减少火灾潜在损失和灭火成本。“预防为主,积极消灭”是我国森林防火方针。如何从大量的历史森林火灾数据中挖掘出有用的知识以供决策者参考是现在急需解决的问题。
二、数据挖掘技术在森林火灾中应用研究
数据挖掘是一个融合了多项技术的研究范畴,它集成了数据库技术、机器学习、人工智能、统计学、知识库系统、信息检索等最近技术的研究成果。还有许多与其相近的术语,如从数据库中发现知识(Knowledge Discovery in Database, KDD)、数据分析(Date Analysis)、数据融合(Data Fusion)以及决策支持等。2001年,Gartner Group在一次高级技术调查中将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关键技术”之首,还将并行处理体系和数据挖掘列为未来的五年内投资焦点的十大新兴科技前两位[1]。
20世纪80年代末开始出现了发现知识(KDD)一词,在1989年8月美国底特律市举办了第一届KDD国际学术会议上第一次提到了该词的概念。起初每两年举办一次KDD 会议,到1993年后一年举办一次。直到1995年加拿大的蒙特利尔举办了首届KDD &Data Mining的国际会议,才开始流行知识发现和数据挖掘。之后,在国外有关数据挖掘相关的论文发表得十分多,并形成了比较热门的研究方向,比较集中发表的论文期刊如:《Data Mining and Knowledge Discovery》、《Artificial Intelligence Review》[1]。
在国内,1993年中科院合肥分院获得我国自然科学基金首次在数据挖掘领域的研究的支持。通过检索被科学引文数据库(SCI)、工程索引数据(EI)和清华全文期刊数据库(CNKI)收录有关数据挖掘方面的文章,可知:1997年中国有关数据挖掘的文章在SCI收录了2篇,CNKI中收录了3篇,这说明在数据挖掘方向的研究,中国与国外在时间上相差不大。国内有关数据挖掘论文的发表也逐年增加,说明中国的数据挖掘研究也正在加强[1]。
数据挖掘是面向实际应用的技术。现已广泛地应用在金融、电信、保险、农业、制造业、医疗卫生等领域,数据挖掘在农林火灾中的应用研究也引起了国内外专家学者的关注。
Tao Cheng等探讨了时空数据挖掘在森林防火中的应用,特别关注森林火灾的时空预测,提出了一种集成时空预测ISTFF框架:使用一个动态递归神经网络的空间预测,然后以加拿大森林火险区预测为例,与其他方法做了比较。Paulo Cortez等探索了数据挖掘方法来预测森林火灾的燃烧面积,在基于最近葡萄牙东北部收集的真实数据,测试了五种不同的DM技术(如支持向量机(SVM)和随机森林)和四种不同的特征选择设置(使用空间、时间、火灾森林指数(FWI)和天气属性)。最好的配置是使用了一个支持向量机(SVM)和四个气象输入(即温度、相对湿度、雨、风),它能预测更加频繁小火的燃烧面积。这对提高消防管理尤其有用。
刘芳[2]针对K均值中容易出现局部最优的缺点,引入了蚁群算法ICACA对其进行优化,提出一种改良的蚁群聚类算法,利用实验对比,新的算法能够在时间上和聚类的准确性上获得一个平衡,然后运用在预测分析实际的森林火灾中。苏成伟[3]将模拟退火算法与遗传算法结合起来,形成了模拟退火遗传算法,将该算法应用于关联规则的挖掘中,然后在森林火灾数据中应用改良的算法。印世乐针对传统的遗传算法容易陷入局部最优和早熟的缺点,提出了一种改进的多种群遗传算法,然后将算法应用于森林火灾数据进行关联规则挖掘。王轩为了能够实时监控林中的温度、相对湿度等火灾因子,运用ZigBee无线传感器网络、Internet网络、GPRS数据通信等技术构建了基于物联网技术的远程监测系统。许志卿在研究中运用半正规规划建模方法,建立了自定义核函数的SVM模型,对比了线性核函数的模型、基于自定义核函数的SVM模型和基于高斯核函数SVM模型三种林火预测模型的预测效果,设计并实现了基于这三种模型的林火预测系统。
参考文献
[1] 李菁菁,邵培基,黄亦潇.数据挖掘在中国的现状和发展研究[J].管理工程学报,2004(03):10-15.
[2] 刘芳.改进的蚁群聚类算法在森林火灾预测中的应用研究:[硕士学位论文].阜新:辽宁工程技术大学,2009.
[3] 苏成伟.一种改进的遗传算法在数据挖掘中的应用研究:[硕士学位论文].合肥:合肥工业大学,2013.