改善数据仓库中数据质量的方法

来源 :2009国际信息技与应用论坛 | 被引量 : 0次 | 上传用户:werr2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了利用ETL调度以及校验的方式来提高数据仓库中数据质量的方法。首先,利用ETL调度原理实现教据的自动化调度,使数据成为一个流动的数据流,数据所在的教据库作为ETL流的起点,保存最终高质量数据的数据仓库作为ETL数据流的终点。其次,对于已经形成ETL数据流的数据生成流实例信息,对完成ETL流程处理的数据构造历史信息,从而保证能够对ETL流进行监控。构造自动化的校验程序,使数据流流过时校验程序能够纠正错误数据,最终达到获得高质量数据的目的,保证了数据仓库中数据的稳定性。
其他文献
首先介绍了Web环境下异构数据集成技术产生的背景和研究目的,同时介绍了与此相关的概念、技术和方法,然后针对XML拥有合适的数据交换格式的特点,介绍了基于XML的信息集成的关键
隐式广义预测自校正控制根据输入输出数据直接辨识求取最优控制律,具有较强的鲁棒性。通常用试凑的方法设计控制器参数,往往难以达到最佳效果。提出了一种基于遗传算法的隐式广
会议
将合同网协商方法用于生产调度领域是当前研究任务调度的热点,旨在解决生产调度中任务分配的问题。首先,提出生产任务调度的领域模型,给出其调度流程的形式化描述;重点提出一种基
会议
介绍了栅格的基本概念、体系结构,分析了目前制约分布交互仿真技术发展的主要因素,并结合栅格技术的特点提出了解决这些制约因素的方法,最后提出了栅格技术在分布交互仿真高层体
信息融合是一个跨学科的研究领域,旨在合并不同的信息来源的数据和信息。信息融合系统的服务形式是提供一个全局查询接口供用户从分散的数据源中获取数据和信息。由于Web与传
会议
设计并实现了一种基于H.264编解码协议的电视制导视频传榆子系统。首先给出了以TMS32DM642芯片为核心的硬件系统组成方案,然后基于该硬件系统利用X264开放源代码和DSP软件开发
会议
基于P2P的下一代互联网命名系统是在纯IPv6网络中提供域名解析服务的一种新架构,由动态产生的DNS服务节点来分担域内DNS域名解析、域名注册、域名更新的负载。介绍了针对这种
肝细胞性癌(HCC)和转移性肿瘤之间的鉴别诊断有时可能比较困难。Arginase-1(Arg-1)是最近一些文献报道中发现的一种新的HCC标记物。该研究对1 240例肝脏内肿瘤的外科切除标本
互联网的发展对数据安全的要求越来越高,但是却缺少提高数据安全的有效手段及方法。在分析当前网络数据安全的现状及特点基础上,将无盘网络及动态分布式数据存储技术应用于已有
公平交换协议的结构常常比较复杂,可能由多个子协议组合而成,并不一定按顺序结构执行协议。因此,公平交换协议的公平性分析需要选择适宜的形式化方法。扩展了串空间逻辑,利用扩展