论文部分内容阅读
研究了利用ETL调度以及校验的方式来提高数据仓库中数据质量的方法。首先,利用ETL调度原理实现教据的自动化调度,使数据成为一个流动的数据流,数据所在的教据库作为ETL流的起点,保存最终高质量数据的数据仓库作为ETL数据流的终点。其次,对于已经形成ETL数据流的数据生成流实例信息,对完成ETL流程处理的数据构造历史信息,从而保证能够对ETL流进行监控。构造自动化的校验程序,使数据流流过时校验程序能够纠正错误数据,最终达到获得高质量数据的目的,保证了数据仓库中数据的稳定性。