论文部分内容阅读
随着全省地税数据大集中的完成,如何利用这些数据,如何有效地从海量的数据中发掘出可用信息,便是本文要解决的问题。 随着我省地税全省数据大集中,积累的税收数据日益增多。大量信息在给人们带来方便的同时也带来了一大堆问题:第一是数据过量,难以消化;第二是数据的真假和重要级别难以准确辨识好划分;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。而现有的数据处理办法虽然能够高效实现数据的录入、查询、统计,但无法发现数据中存在的关联关系和数据规律,缺乏挖掘数据背后隐藏的重要信息的手段,形成了“数据爆炸但信息贫乏”的现象。但是,对我们多年来累积下来的数据,如果不加以挖掘利用,无疑又是巨大的浪费。 那么,如何才能从海量的数据中及时发现有用的信息、如何才能提高数据的有效利用率,最有效的办法就是在税收数据管理中引入数据挖掘技术。