论文部分内容阅读
借鉴人工智能领域的机器学习研究成果,本文提出一种采用决策树算法进行居民地智能选取的新方法.该方法将制图专家对居民地交互式综合的结果作为参照,对其进行结构化描述并构建和转化为案例库;然后,采用决策树算法对案例库中的案例进行分类,把制图综合问题转化为分类问题,从案例库中归纳出if-then规则,进而指导同类居民地的自动综合.居民地的综合相比与其他要素来说需要考虑的因素更为复杂,参杂更多制图专家的主观判断成分,难以采用数学的方法对制图规则进行形式化表达.然而从认知与行为的关系角度来看,这部分“主观性”综合并不是无规律可寻的,而是建立在人类认知规律的基础之上,满足某些隐含规则的推理过程.制图专家的主观判断在一定程度上保证了综合结果更加符合人类的认知习惯,增强了地图的可读性.通过机器学习中的决策树算法[2-5],可以对专家的制图综合案例进行分析,挖掘出隐含在专家案例中的if-then规则,从而指导计算机进行同类型下的居民地综合过程.基于以上思想,本文首先从综合的角度设计了描述居民地要素的输入参量;对输出参量进一步划分,划分为选取、删除、显性合并和隐形合并四类,增强推理结果表达的准确性;采用C5.0决策树算法对专家综合案例进行决策树分析,挖掘出隐含在案例操作中专家的综合规则,并根据得到的规则实现居民地的自动选取;最后在试验中检验了该方法的科学性和准确性,并得到如下结论:(1)总体上来说,该基于决策树算法的居民地自动综合方法取得了较明显的效果.运用该方法可以在获得一定量的专家选取结果的情况下,迅速地对同类居地进行有效地综合.(2)输入参量的设计是该方法能否取得理想效果的重要环节.通过观察试验中所得到的规则可以看出,临近居民地等级差(LD)和行政等级(L)两个参量并没有参与最后规则的生成,说明这两个参量在本次试验所对应类型的居民地综合中不是决定综合结果的主要因素,但不排除这两个参量在其他类型的居民地综合中的作用.同时除了本文所考虑的六个参量外,专家在选取的过程中很可能还考虑到了其他的因素影响,例如居民地形状特征、居民地分布规律等.需要与制图专家进行进一步沟通,增加有效的居民地描述参量,才能进一步改善推理规则的准确性.(3)仍存在部分误判结果的原因有两个,一是训练样本(居民地综合案例)由于其数量和质量的限制,不能完全具有代表性;二是专家在选取过程中存在经验上的模糊性,即对于某些情况类似的居民地在多次综合中不一定每次都采取相同的综合操作.这两方面影响都可以通过增加训练样本的数据进行有效的改善.