基于因子分析的数据质量评估

来源 :湖北大学 | 被引量 : 0次 | 上传用户:allen_liliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国金融业、保险业、电信行业纷纷投入大量的精力、财力着手进行数据仓库项目的建设,它使人们从一个全新的角度认识到信息系统的重要性,也使人们发现了历史数据的价值。从此数据不仅仅用于检索,还可以用来分析整个企业(或组织)的运行状态以及未来的发展趋势,为决策和管理提供支持。但同时也发现一致、清晰、准确且可访问性、可用性较好的数据是数据仓库系统的基础。如何在数据仓库体系结构基础上进行集成和扩充,形成与数据仓库自身体系相适应的数据质量检测控制体系成为急需解决的问题。作为集团成员之一的湖北电信,决定以Teradada数据仓库平台为基础,并辅以Teradata Warehouse Miner数据挖掘解决方案,建立一套省级经营分析和决策支持系统,通过集中、稳定地整合全省1,800多万用户的数据信息,基于Teradata构建起以客户为核心的统一企业数据视图,以逐步实现由外延式发展向内涵式发展的转变。   本研究分析了目前的主要数据质量评估方法,指出了相对于业务系统而言,数据仓库环境下的数据质量评估的不同特点,即数据仓库中数据质量的时变特征、数据仓库中数据质量的放大效应及数据仓库中数据质量的用户角色特征,提出了基于因子分析数据质量评估模型。使用数据仓库中出现的数据质量问题作为初始变量,使用因子分析的方法抽象出数据质量评估指标,以及这些评估指标对数据质量的贡献率。将数据质量评估指标与数据仓库中的角色对应,利用因子分析的结果,更好地指导各种角色抓住主要矛盾,规范操作流程,从而保证数据仓库的数据质量。建立了数据质量监测和评估系统(DQCAS),以帮助数据仓库各角色监测和发现数据质量问题,提升企业级数据仓库的数据质量。
其他文献
随着电力改革的深入和竞争机制的逐步引入,电力市场对电力企业的运作效率和灵活性提出了更高的要求。过去多年的信息化发展,电力企业各部门依据自身业务发展的需要,建设了适
随着厂区规模的扩大,厂区电网复杂性日益凸现,继电保护在安全生产中的地位越来越重要。用户对电网系统的继电保护提出了更高的要求,特别是对大型企业复杂厂区电网继电保护智
近年来,随着我国电力系统的不断发展以及分布式电源使用规模的逐年增加,使得短路问题日益凸显,因此研究能够有效限制电力系统短路容量并提高运行稳定性的故障限流器受到了人
Ca2+是细胞内普遍存在的一种信号分子,作为第二信使,在细胞的许多生理活动中起着重要的作用. 本文通过改进Fire-Diffuse-Fire(FDF)模型研究传播形式以单个钙火花为基本单位的
随着计算机的处理器运算速度、存储容量不断提高以及网络、多媒体技术的快速发展,使得文本、图像、视频、音频等数字产品日益丰富。数字产品的批量复制和易传播特性在给人们带
图像分割是图像处理的一个重要的分支领域。这一问题看似简单,但就提高分割图像质量的目的来说却是一个相当困难的任务。另外由于数码技术的迅速发展,在自然光照下获得文本图像
带钢生产中,精准地控制板带厚度是必不可少的重要环节,通常采用带有自动厚度控制(AGC)的装置,确保板带轧机厚度控制的精度。研制一套完善的AGC控制装置,对于实现高精度板带材
随着我国国内资源日益紧缺,负荷日益增长,由分布式电源组成的微电网成为近年来的研究热点。微电网安全可靠的运行离不开精确的控制和保护。由于微电网中逆变型微电源的特点,
风力发电的电网穿透率不断上升,为电力系统调度带来了巨大的困难和挑战。一方面大规模风电并网使电力系统面临供需失衡的窘困局面;另一方面电力系统发电侧备用资源匮乏。为保
基于FFT算法的电力系统谐波检测装置,大多采用DSP设计。DSP是采用哈佛结构设计的一种CPU,运算能力很强,速度很快;但是其顺序执行的模式限制了其进行FFT运算的速度。现场可编程逻