论文部分内容阅读
海量的空间数据集隐藏着丰富的知识,但目前空间数据挖掘研究的进展却较为缓慢。论文提出的热点挖掘试图从空间数据集中识别出隐藏的、有趣的模式,解决目前空间数据丰富而知识匮乏的问题。作为数据挖掘的技术载体—数据挖掘系统,经过几十年的演变已经发展到了第三代。但目前各种挖掘系统各自独立,异种系统之间交互困难。而作为系统核心的挖掘算法,往往以插件的形式嵌入系统中,使得系统在算法的增添上存在困难,算法插件的可重用性也比较低。Web Services技术将较好地解决以上问题。本文的主要研究工作如下:阐述了空间聚类,空间离群挖掘,时序数据挖掘的国内外研究进展,概括了数据挖掘系统的发展历程。论文提出了基于空间数据挖掘技术的热点挖掘的概念,它从事物、现象和事件的空间位置、空间分布、空间形态和空间关系的模式和规律出发, 通过研究和开发适于“热点地区”或“热点事件”识别和预警的空间数据挖掘的关键技术和原型系统,探索从海量空间数据中进行热点目标的探测、提取和反演的理论与方法,为疾病(传染病)控制、犯罪预防、突发事件预警、灾害防治和发现全球热点区域等领域提供决策辅助的理论依据。Web Services技术是一种先进的软件集成技术,论文提出利用Web Services技术构建挖掘系统的思想,把多种来源的挖掘算法作为服务集成到系统中来,不仅可丰富系统的数据处理能力,也使得系统的灵活性大大增强。论文在深入分析数据挖掘系统和Web Services技术相关理论的基础上,着重研究了建筑在Web Services之上的面向热点识别的数据挖掘系统HsMiner。该系统把面向服务的体系结构和传统的数据挖掘三层体系结构相结合,在中间挖掘层内插入一个UDDI注册中心作为算法管理模块,用于算法服务的发布,发现与集成。论文以福州地热资源热点挖掘为例演示了热点挖掘的实际应用,也证明了HsMiner系统的有效性。