数据清理及其在数据仓库中的应用

来源 :计算机应用研究 | 被引量 : 58次 | 上传用户:BCB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库是为决策服务的,这里的数据是从各种异构的数据源中采集过来的。由于各个数据源中的数据可能存在错误以及种种不一致性,因而为了确保决策数据的质量必须要对各个数据源中抽取出来的数据进行清理转换。数据清理就是发现数据源中数据的错误并加以清除或修改,发现和纠正数据源之间数据的不一致性。分析了数据清理概念和方法以及在数据仓库中的应用。
其他文献
详细介绍了国际机器人足球联盟FIRA(FederationofInternationalRobot soccerAssociation)于2001年在北京举办的全自主机器人比赛系统。详细描述了该类机器人的技术特点、工作方式,以及比赛中涉及到的一些关键性技术。
从企业信息化技术路径着手,详细讨论了企业经营管理信息化技术中的ERP,CRM,SCM,PDM和生产过程管理信息化技术中的智能集成传感器、现场智能测控装置、开放控制系统、先进控制技术以及故障诊断技术等对企业信息化的作用和影响,详细分析了连接经营管理信息系统和过程管理信息系统的MES、工厂软件、OPC服务器、实时数据库和数据仓库在企业信息化中的地位和作用。
运用电、磁、图像等各种信息的融合,提出了一种比较有效地用于娱乐机器人目标识别的方法,进行了仿真并通过了实际运行的检验。
讨论了基于Extranet网络和XML技术,给出了一种面向供应链的先进采购管理模式,实现了采购的智能决策,达到了采购的优化管理。
AOSD(Aspect OrientedSoftwareDevelopment)作为一种通过对软件系统中相互独立的特性进行分离和建模,达到提高模型清晰度、可跟踪性和可维护性的新技术,近年来逐渐成为学术界和工业界的研究热点。在AOSD方法的编程语言支持方面,现有的AOP(Aspect OrientedProgramming)语言的研究和实现多数是基于Java语言,而对C++这个最重要、最广泛使用的编
本文介绍了利用图像采集卡开发机车仿真器的视景叠加系统的硬件系统组成和软件开发原理。阐述了该视景以叠加系统与一般的视频图像叠加的不同之处,讨论了实现该系统的一些关键
本文介绍了在模板的设计开发过程中,如何运用WordBasic进行宏编程的几点经验。
首先分析了应用系统整合方案中存在的问题,讨论了传统"胶水"整合方案的结构及其特点。在此基础上,提出了CebXML框架的概念,介绍了CebXML框架的理论基础和产生的背景,并对CebXML框架进行了详细的需求分析和结构设计。
本文介绍了目前国内三种流行局域网WINDOWS NT、NETWARE和SUN SOLARIS系统集成的实现方法。
护理论文评审是一项工作量大且易受人为因素干扰的工作,为此设计了“护理论文评审的计算机管理系统”。评审文档和处理结果存储在Lotus Notes数据库中,评审结果可以随机检索查询,以图表或