论文部分内容阅读
本文在对现有研究成果进行分析和总结的基础上,设计并实现了地球科学数据中时空异常事件关联挖掘方法。研究内容和成果主要包括以下几点:
1、高效的时空高维聚类算法
本文利用地理学第一定律将邻近约束加入SNN算法中,提出了带邻近约束的SNN聚类算法,实验并分析了带邻近约束SNN算法的特点。带邻近约束的SNN算法继承了SNN算法克服相似性度量在高维空间区分度差的优势,并且在较优保证聚类结果的情况下,效率提高显著(从O(n2)提高到O(n))。
2、适合地球科学领域特点的片段关联挖掘算法
传统的片段关联挖掘算法并没有考虑事件之间存在时间延迟的情况。此外,由于地球科学数据中的空间自相关特点,若是在将所有异常事件合成为一个序列之后再进行挖掘,通常会得到很多意义类似的规则。这类规则的前缀和后缀的事件类型相同,但却来自相近的地理区域。针对这些问题,本文提出了带时间延迟和约束的片段关联规则挖掘算法。
3、设计并实现地球科学数据中时空异常事件关联挖掘原型系统
原型系统是用Java实现的,主要模块有数据装载、数据预处理、空间聚类、片段关联挖掘、异常事件提取和图形化用户界面等。系统提供了简单、灵活的数据访问接口,可以方便的使用文件和数据库装载数据;系统还提供了简便的可视化操作界面和以地图方式展现结果的功能;在挖掘过程中的每一步,都可以通过图形化用户界面察看中间结果。