论文部分内容阅读
信息技术的高速发展,信息系统使用更加普及,为人们带来极大的便利,但是随着系统中的数据日积月累,数据质量问题变得越来越突出。劳动力市场的信息化建设被纳入了国家“金保工程”内容之一的国家电子政务建设方案中。随着时间的推移,劳动力市场信息系统产生了大量的“脏数据”,降低了数据准确性和系统服务的质量。本文的研究正是基于这样的实际背景和需求提出的,并且纳入了2007年度浙江省科技支撑和引导计划面上项目“基于网格的分布式劳动力市场决策支持系统”研究课题之中。本文的主要工作有:1、总结出了一套具有全面性、通用性的信息系统数据质量分析评估指标体系。2、在分析评估指标的基础上,设计了一个可量化的数据质量评估模型。评估模型主要从评估角度、数据重要性及指标综合得分三方面综合考虑数据质量。3、提出了基于指标分析的数据质量分析方法和分析型数据清洗的概念,并设计了分析系统。系统包括五个层次结构:数据库层、数据视图层、控制层、数据分析层、交互层;并详细说明了系统针对正确性、完整性、唯一性、一致性、准确性、有效性、时效性这7个分析指标的数据质量分析方法。4、利用分析系统对杭州市劳动力市场信息系统进行数据质量分析,总结了劳动力市场信息系统数据质量问题的产生原因,并提出改进建议。