论文部分内容阅读
分类是数据挖掘领域中的重要研究方向,随着数据仓库和联机分析处理技术的发展,大量的数据被存储在数据仓库系统中,传统分类算法的不足逐渐显现出来,比如缺乏用户的导向和控制,不能根据OLAP分析、分类目标以及已有分类器性能动态地选取样本空间等缺点,有必要引入基于OLAP驱动式的动态分类挖掘方法。数据联机分析挖掘(OLAM)是将OLAP和数据挖掘有机结合,它能方便地对任何一部分数据或不同抽象级别的数据进行挖掘,得到更为详细、更为有用的信息,成为了数据挖掘研究的热点。
“三江并流”地区特殊和复杂的生态环境造就了这一地区独特的植物物种和分布,使其成为植物多样性最丰富的地区之一。因此,在“三江并流”代表性植物数据仓库上研究“三江并流”区域代表性植物的物种分布及其与生态环境的关系,不仅可以丰富和发展计算机学科的数据仓库及数据挖掘的理论与技术,而且可以促进“三江并流”地区植物多样性研究。
本文首先对数据挖掘中的技术之一——数据分类进行研究。论文详细分析了现阶段比较常用的分类算法,并重点介绍了神经元网络分类方法。针对“三江并流”代表性植物数据仓库中植物分布主题的数据结构特点以及分类研究的目标,引入了基于。BP神经元网络的分类方法,然后,在“三江并流”代表性植物数据仓库基础上讨论了基于OLAP驱动式的动态分类方法,提出了基于OLAP驱动式的神经元网络分类方法,最后,在“三江并流”代表性植物数据仓库上验证了该分类方法的正确性和有效性。