论文部分内容阅读
随着林业信息化与智能化技术的不断发展,林业数据获取与存储能力的不断增强,林业数据体量将持续增长,数据格式与种类也愈加多样化。基于可视化可视分析方法深入分析和洞悉林业数据的模式和规律,解决林业生产科研中的问题,给林业行业的发展带来了新的机遇和挑战。森林容易遭受各种自然灾害的侵袭和人为因素的破坏,而森林病虫害作为最主要的森林自然灾害,给森林资源带来严重的威胁,给林业生产带来重大损失。森林病虫害数据的分析存在诸多困难和挑战。首先,森林病虫害数据体量大、结构复杂、多层次且高维度,而且涉及时空属性,不同时间和空间粒度的分析结果千差万别。其次,数据中各属性并非完全孤立,属性间存在不同程度的联系。利用传统统计学方法进行分析难以直观地呈现数据间的联系与规律,因而从中挖掘有价值的信息非常困难。数据可视化是一种使用人类可感知的视觉符号来增强数据认知的有效方法,可以辅助数据分析者直观地观察和分析数据蕴含的规律。本文针对森林病虫害数据分析中存在的问题,以交互式可视分析为研究核心,围绕森林病虫害数据建模、可视化和可视分析方案设计等问题展开分析和研究,以期为森林病虫害研究与管理人员更好地管理、监测森林病虫害的发生发展,指导病虫害的科学防治提供更有利的平台。本文主要研究内容和贡献概括为以下几个方面:1、设计了一种可视数据清洗方法,用于提高森林病虫害数据的数据质量。在数据清洗过程中为了比较森林病虫害文本型数据的相似性,提出了文本型数据相似性匹配算法。针对森林病虫害数据的特点,设计了可视数据清洗框架,对数据进行交互式地检测分析及清洗,实现对数据质量的有效控制。2、设计了一种聚类数据可视分析方法,其可定量评估森林病虫害发生情况在各地区的相似性。在可视化绘制算法研究方面,提出了权值均分有序树图布局算法对树图进行优化以展示森林病虫害数据中的有序层次数据;提出了基于引力场的聚类边绑定算法对平行坐标进行优化以展示森林病虫害聚类数据的分布特征。基于此,提出了用于揭示各地区森林病虫害发生相似性的数据聚类可视化方案。3、基于三种模型的多视图协同可视分析方法的设计。提出了多视图协同可配置模型,其可针对相似数据分析情景模式进行配置;基于该模型针对不同的情景分析模式所包含的数据属性是否一致,设计了不同的可视分析模板对森林病虫害发生防治情况进行分析研究。提出了层次关联交互模型,该模型用于指导多个具有层次性的属性进行渐进式关联交互分析;基于该模型提出了分析不同病虫害在不同地区的发生发展情况的交互式多视图协同可视分析方法。提出了多组合多元线性回归模型,该模型可以定量地描述多个自变量与单一因变量之间的多种组合构成的线性关系;基于该模型和数据流模型并结合统计学原理和可视化技术提出了多组合多元线性回归可视分析方法,针对森林病虫害病情指数与可能导致其发生的影响因素的特点展开分析研究。4、设计并实现了基于森林病虫害数据的可视分析原型系统。基于论文所提出的模型和方法,结合森林病虫害发生防治的时序、地理、灾害等级、灾害种类等特征,综合考虑不同时期、不同地区的发生防治情况,以及导致森林病虫害发生的影响因素等数据,实现对森林病虫害的多角度综合性分析,从而提供一种快捷、方便的森林病虫害数据观察及分析工具。5、基于论文所设计实现的原型系统,针对真实的森林病虫害数据进行研究,分析病虫害数据的时空特性及多维属性间的关系,对森林病虫害发生的影响因子进行探索,以期找到影响病虫害发生的关键因子。实施了相关用户研究和专家评估以验证上述所提模型、方法等的可用性和有效性。本文研究工作结合了数据挖掘、可视化分析和数理统计方法,为解决森林病虫害数据分析和利用面临的问题,探索了新的思路和技术手段;为辅助森林病虫害研究与管理人员全面掌握森林病虫害发生防治情况,采取科学防治措施提供依据。