论文部分内容阅读
目前,数据挖掘各项技术的应用是国内外学术界的研究热点。数据挖掘技术在许多商业应用中都取得了十分理想的效果,但是在林业生产过程中,应用数据挖掘成功的例子还不多见。本论文以塔河数字林业信息化建设的项目为依托,以塔河二类数据库为数据源,以预测营林立地质量为挖掘目标,以Oracle提供的ODM为数据挖掘工具,将数据挖掘的各项技术与营林科学理论相结合,清晰的阐释了林业数据挖掘的流程,并比较了当前数据挖掘的两类重点技术——决策树分类技术和支持向量机分类技术在林业数据挖掘中的应用,通过对两种分类技术所得预测结果准确度的对比分析,证明了本研究方案应用决策树分类技术建立适地适树规则的可行性和准确性,同时通过对生成的决策树进行优化处理、析取规则,建立了塔河林业局马林林场的适地适树规则集,为塔河林业局开展科学营林工作提供决策。数据挖掘的部分技术在林业数据挖掘流程中的具体应用是本论文的着眼点和主要研究内容,本论主要包括以下几部分内容:首先,本文介绍了数据挖掘的任务、原理、数据挖掘的基本流程以及各项挖掘技术在林业中的应用现状。其次,本文介绍了应用在本次林业数据挖掘流程中各主要技术的原理,本次研究所使用的数据挖掘技术主要包括主成分分析原理、最小描述长度(MDL)原理、决策树分类技术和支持向量机分类技术。最后本文运用Oracle提供的数据挖掘工具ODM,以通过挖掘塔河林业局马林林场立地因子吸取适地适树规则为例,详细介绍了文中各项数据挖掘技术在林业数据挖掘中的应用。并通过对两种应用结果准确度的对比分析证明了本文所采用的技术路线的可行性和生成结果的准确性。