论文部分内容阅读
由于水文时间序列数据挖掘呈现多种算法动态组合的特点,如果针对某类算法开发出一个单一功能的系统,扩展性不好,很难进行系统的升级和移植,维护费用高,无法组合利用其它的挖掘算法。为此,水利领域迫切需要能有一个柔性的、扩展性强、可移植、易维护且易于使用的数据挖掘柔性集成系统,来为水文时间序列数据的挖掘工作服务。 经过对水文时间序列数据挖掘过程的分析,可以得到,虽然其中的业务逻辑构成比较复杂,但其基本成份却有许多相同或相似的部分,所以,一般可以将时间序列相似性搜索的过程分为数据预处理、特征模式挖掘和相似性度量等几个连续的阶段,而每个阶段里都有许多完成相同功能的基本算法。如果为这些基本算法分别都开发出一套单独的系统,显然是不合理的。为此,本文提出了一个基于J2EE平台的面向水利领域的时间序列基本算法组件柔性集成技术方案,对该方案的合理性和可行性进行认真的分析研究,在此基础上设计了一个水文时间序列基本算法组件柔性集成系统,实现了基本算法组件的柔性集成目标,验证了该方案的正确性和可靠性。 本文主要的工作如下: (1) 对水文时间序列数据挖掘相关基本算法进行了分析研究,包括数据预处理、特征模式挖掘和相似性度量等典型的基本算法。 (2) 参照EJB2.0组件规范,提出了基本算法组件抽象类接口和组件接口规范,设计出算法组件管理器,描述组件柔性集成的具体机制。 (3) 根据水利领域的特点,设计出了一个水文时间序列基本算法组件柔性集成框架,并分析其结构及功能特点。 (4) 基于J2EE平台,综合上述组件技术及集成框架,设计出了一个面向水利领域的水文时间序列算法基本组件柔性集成系统,对柔性集成机制和框架的有效性与正确性进行了验证。