论文部分内容阅读
当今社会已经进入了网络信息化时代,计算机与网络信息技术的快速发展使得各个相关领域的数据和信息急剧增加,并且由于人类的参与使数据与信息系统中的不确定性更加显著。如何从大量的、杂乱无章的、强干扰的数据中挖掘潜在的、有利用价值的信息,这给人类的智能信息处理能力提出了前所未有的挑战。在粗糙集理论研究的诸多方面中,对信息系统的约简、求解最小约简不但是粗糙集理论研究中涉及到的基本问题,而且也是最为关键和棘手的问题。大部分传统的粗糙集方法没有与数据库系统结合起来,使得粗糙集理论很难适应于现实的数据库规模,因而研究基于数据库环境下的高效、快捷的属性约简算法是该理论研究的现实课题之一。本文简要介绍了属性选择问题和粗糙集模型,并分析研究了基于粗糙集模型的属性选择算法。由于传统的粗糙集模型没有与关系数据库系统结合,该模型许多计算的基本操作都是在文件上进行的,没有利用高性能的数据库集合操作。而基于数据库系统的粗糙集模型在关系代数的基础上对核属性和约简进行重新定义,从而利用高效的面向集合的数据库系统操作。本文根据基于数据库系统的粗糙集模型,对基于数据库系统的启发式算法进行了改进,将属性重要性的启发信息值由静态改为动态,从而能有效的求得最小约简属性。同时,本文使用Jbuilder,Java等工具开发了一个基于数据库系统的数据约简工具DBReduced,并对该工具进行了测试,而且将DBReduced工具应用于社保联网审计中,对社保数据进行约简,并取得了预期的效果。