论文部分内容阅读
数据仓库是数据挖掘的重要基础,要提高数据挖掘的质量,就必须提高数据的质量,在数据仓库环境中提高数据质量是一个复杂艰苦的工作,需要持续不断地进行,才能有效地改善数据质量。提高数据质量的方法主要有:入数据仓库前对数据进行数据预处理,特别是其中的数据清洗,它能明显的改善数据质量;在使用一段时间后,要定期对入数据仓库后的数据进行数据刷新、数据过滤等措施,以保证数据仓库中的数据是有效的、最新的,能对人们进行知识决策提供支持。