论文部分内容阅读
随着计算机技术的发展,借由计算机的高速运算能力,通过将规则和逻辑程式化,以机器智能代替人类完成某些繁杂耗时的工作已成为可能。将国土资源监测中规律性强、重复性高、智能性低的工作交予计算机处理,从而解放大量人力,提高工作效率,即提高更新自动化的研究日益受到重视。目前应用遥感影像更新地物的工作主要由作业员手工完成,占国土资源更新工作总量一半甚至80%以上。居民地和水体是国土资源更新的重点,提高居民地和水体更新智能化、自动化程度,是目前亟待解决的问题。由于地物复杂多样、外界环境多变、季节气候等条件差异大,同一地物在不同遥感影像中往往呈现不同特征。将居民地和水体分为若干子类,每个子类内部特征相对单一、特征分布集中,针对各子类构建模型用于提取居民地和水体,是提高算法稳健性的途径之一。但模型设置、模型参数求解通常比较复杂。可视词语区域检测(VWRD, Visual Word Region Detection)将文本中的最小语义单位“词语”对应于影像中的“可视词语”,将文字识别的相关技术引入影像分类,用于解决模型设置和模型参数求解的问题。但文本与影像存在诸多差异,如何将VWRD算法合理应用于遥感影像居民地和水体提取,仍需在大量实验的基础上,进行深入地研究和探讨。主要内容包括:系统地介绍和分析VWRD的概念和原理。考察文档识别中重要的原理和技术在遥感影像地物提取中的适用性。讨论VWRD采用的学习机制,包括可视词语集和可视词语语义的学习机制。阐述VWRD的推理机制,说明VWRD根据学习结果获得未知检测样本类别的方法。提出一种基于可视字母的构词方法,与传统构词法相比,该方法具有突出每维特征差异、语义明确、构词灵活、可扩充性强的优点。将可视字母与经验知识有效结合,能够构造经验模型用于遥感影像面状地物分类。总结可视字母构词法的两大基本问题,即如何生成可视字母表和如何选择可视字母构造可视词语。针对第一个基本问题,采用熵函数C均值聚类的方法获得最佳聚类数,生成最佳可视字母表。针对第二个基本问题,将可视字母的概念与遗传算法相结合,根据训练样本的影像特征自适应选择纹理特征,构建可视词语,建立模型库。采用低层特征表达面状居民地和水体模型时,通常存在特征局部不可分的情况,在VWRD中,表现为可视词语存在多义性。针对这一问题,提出相应的解决思路,即引入上下文语境信息,解决多义可视词语歧义性的问题。分析基于语境信息推理目标语义的方法,探讨如何将语义信息作为先验知识,应用于贝叶斯推理。针对遥感影像面状目标分类,以可视词组和马尔柯夫随机场(MRF, MarkovRandom Field)这两种不同的模型将语境信息引入VWRD算法,优化分类结果。对文中涉及的相关算法进行比较实验,检验算法应用于遥感影像面状居民地和水体提取的效果。将本文提出的方法应用于变化检测系统研发,介绍该系统在广州、武汉、北京、四川测区国土资源更新中的应用、改进和完善。