论文部分内容阅读
土地评价是土地利用与规划的关键步骤,是土壤科学研究的主要内容之一。土地评价一直是一个较为复杂的问题,不同地区对农业生产具有不同的影响因子,各影响因子对不同的生产目标又存在不同的作用,选取评价指标和确定权重仍然存在困难。另外,土地质量的高低是诸多因素综合影响的结果,且因素之间在其地理过程中存在着不同程度的相互关联性。准确地进行指标的定量化和取值,难度较大,人为因素较多,对评价的结果影响较大,从而影响了土地评价的准确性和精确性。为了突破人为因素的限制,探索更加切合实际、准确高效的土地评价方法,提高土地评价效率,使评价结果更能反映土地变化的自然规律与本质特征,有着重要的理论和现实意义。
近年来,数据挖掘被成功地应用于许多领域,作为数据挖掘的两个方面,监督学习和非监督学习在处理数据分类中有各自的优势,也有各自的限制,但它们的限制是互补的。土地分等定级实质上是模式分类问题,本论文以广东省第二次土壤普查成果资料和广东省中山市农用地分等成果为主要数据源,对国内外较流行的用于土地评价的分类算法,包括贝叶斯决策方法、BP神经网络、RBF神经网络、概率神经网络、自组织特征映射和聚类方法等,进行了正确率和效率比较研究;并且,为了充分利用有监督学习分类准确率高和非监督学习无需标定类别的学习样本的优点,提出了结合监督学习的关联规则和非监督学习的聚类的监督-非监督的聚类算法。实验表明,基于监督-非监督聚类方法只利用少量的有标定学习样本,即可得到较高的分类准确率,特别在少量训练样本时,该方法能得到比贝叶斯决策方法、BP神经网络和概率神经网络等监督学习方法更好的土地评价结果。因此,在土地评价实际应用中,可以尝试结合监督学习和非监督学习的方法,实现分类正确率和获取大量有类标签的样本之间的折中。
本研究的新颖之处:
利用较少的有标定类别的样本,将有监督学习的关联规则和非监督学习的聚类算法结合的数据挖掘方法,而该方法在土地评价领域中公开发表的论文中尚未发现。