论文部分内容阅读
森林调查是森林工作的重要方面,如连续清查,抽样,数据落实到山头地块,常用的一些统计方法发挥了巨大作用。随着林业的发展,从海量林业数据中智能化提取有用信息正在被广泛地研究,这就是信息度优先问题。为了进一步挖掘森林资源数据的有用信息,更大地发挥已有数据的作用,本文采用信息度优先来拓宽数据的意义。信息度优先是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它可以从大量的数据中发现有趣的模式,它是信息技术的一项必然的变革,有着广泛的应用和大量的需求。信息度优先的评价方法,采用交互指标、频度指标可以描述多指标、交互效应状态,从而可分析出更多有用信息。本次论文就是在这样的背景下,对浙江省森林资源调查数据进行评价和分析。本文主要分为三大部分,第一部分介绍了信息度优先的理论和方法,第二部分用信息度优先的方法对浙江省森林资源数据进行评价和分类,第三部分对信息度优先在实践上的应用做出总结。其中,第二部分又分为三个方面,首先应用信息度优先中的关联规则理论对林分中的地貌、土壤类型、植被类型、林种、龄组、平均胸径、平均树高、郁闭度、群落结构、树种结构、生态等级、土层厚度、健康等级属性间的关系进行分析。其次,运用信息度优先中的EM、AGNES、DBSCAN及自行设计的CDBSCAN算法对浙江省森林资源数据进行了健康等级的分类,并和实际考察的分类结果作了比较,具有较高的正确性,结果是可行的。再其次,应用信息度优先中的C4.5算法对浙江省森林资源数据进行了健康等级的分类和评价,通过不同的数据处理方式,比较了用该算法进行分类和评价数据处理方式上的区别。在本文的最后,讨论了信息度优先所面临的问题与挑战并对论文工作进行了小结与展望。本文研究成果如下:(1)将信息度优先算法应用到林业,并对浙江省森林资源信息进行了分析与探索。(2)在实际应用中,对信息度优先的理论和方法进行了一些探索,对计算方法进行了改进。(3)在研究应用中发现,在林业中尤其在森林资源调查因子的数据分析方面有很大的应用空间,可以拓宽森林资源调查数据的应用范围。(4)本文研究主要侧重在方法拓展和改进,对森林调查因子的分析,有些还需进一步的作分析。